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@ DNA-Sequenzen fur die enzymatische Synthese von Polyketid- oder Heteropolyketidverbindungen 

® Die Erfindung betrifft eine DNArSequenz, deren Ex- 
pressionsprodukte eine enzymatische Btosynthese, Muta- 
synthese oder Partialsynthese von Polyketid- oder Hete- 
ropolyketitverbindungen bewirken oder daran beteiligt 
sind. 
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Beschreibung 

Die Erfindung betrifft DNA-Sequenzen fur die enzymatische Synthese von Polyketid- oder Heteropolyketidverbin- 
dungen nach Patentanspruch 1, und zwar insbesondere zur enzymatischen Synthese von Epothilonen. 
5 Polyketid- oder Heteropolyketidverbindungen, insbesondere Epothilone, der folgenden allgemeinen Strukturformel 
sind beispielsweise aus DE 41 38 042, DE 196 47 580.5 und DE 197 07 501 .6 bekannt: 




0 OH 0 0 OH 0 
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EPOTHILON A EPOTHILON B 

worin R l Wasserstoff, CWAlkyl, Ci^-Acyl, Li\ K\ Na\ V 2 Mg 2+ oder l / 2 Ca 2 + bedeutet und R 2 Wasserstoff oder eine 
Methylgruppe darstellt. 

25 Die Epothilone werden in die l^pen A bis F eingeteilt. Sie haben cytotoxische und/oder immunsupressive sowie anti- 
biotische und antifungale Wirkungen und finden daher zuin Beispiel Anwendung als Mittel fur den Pflanzenschutz in 
Landwirtschaft, Forstwirtschaft und/oder im Gartenbau. 

Die Epothilone wurden bisher fermentativ durch Kultivierung von Sporangium-Stammen hergestellt und durch An- 
wendung herkommlicher Techniken isoliert und gereinigt, vgl. z. B. DE41 38 042.8. 
30 Fermentative Techniken sind aber oft mit Nachteilen verbunden. Der produzierende Mikroorganismus erlaubt nicht in 
jedem Fall die fermentative Herstellung in groBem MaBstab. Haufig kommt es zu Komplikationen bei der groBmaBstab- 
lichen Kultivierung oder die Ausbeuten sind gering oder die Isolierung und Reinigung sind aufwendig. 

Daher ware es vorteilhaft, wenn zur fermentativen Herstellung der gewunschtcn Vcrbindungen ein gut charaktcrisier- 
ter und leicht zu handhabender Mikroorganismus zur Verfugung stunde. Wenn ein solcher aber nicht in der Natur gefun- 
35 den oder geziichtet werden kann, bleibt nur noch die entsprcchende Vcrandcrung eincs gccigncten Mikroorganismus mit 
gentechnischen Methoden. Dazu ist aber die Isolierung und Charakterisierung der enlsprechenden Gene erforderlich. 

Aufgabe der Erfindung ist daher gemaB Patentanspruch 1 die Bereitstellung einer DNA-Sequenz, deren Expressions- 
produkte die enzymatische Biosynthese, Mutasynthese oder Parti alsyn these von Polyketid- oder Heteropolyketidverbin- 
dungen bewirken oder daran beteiligt sind. 
40 Durch die Bereitstellung einer derartigen DNA-Sequenz lassen sich folgende Vorteile erzielen. 

Die DNA-Sequenz laBt sich mit iiblichen molekularbiologischeh Methoden in bekannte und optimierte Expressions- 
vektoren insertieren, wodurch die entsprechende Transformation, Selektion und Klonierung von Zellen moglich ist, die 
dann zur Synthese von Polyketid- oder Heteropolyketidverbindungen durch Fermentation in der Lage sind. Wenn ein 
uberproduzierender Zellklon gewahlt wird, lassen sich die gewiinschten Polyketid- oder Heteropolyketidverbindungen 
45 leicht in groBen Mengen herstellen und gewinnen. 

Die Kenntnis der Lage der regulatorischen DNA-Abschnitte und der einzelnen Strukturgene gestattet die gezielte Mu- 
tagenese ("site-directed mutagenesis") mit iiblichen gentechnischen Methoden und somit die Konstruktion von optimier- 
ten Enzymen ("protein engineering") zur fermentativen Synthese von Polyketid- oder Heteropolyketidverbindungen, 
Die Erfindung betrifft somit femer einen rekombinierten Expressionsvektor nach Patentanspruch 8, damit transfor- 
50 mierte Zellen nach Patentanspruch 9 sowie ein Verfahren zur enzymatischen Biosynthese, Mutasynthese oder Partialsyn- 
these von Polyketid- oder Heteropolyketidverbindungen nach Patentanspruch 15. 
Vorteilhafte Ausfuhrungsformen der Erfindung sind Gegenstand der Unteranspriiche. 
Die Erfindung wird nachstehend detaillierter erlautert 

Fig. 1 ist eine Restriktionskarte der erfindungsgemaBen DNA-Sequenz, die auch die Lage der regulatorischen DNA- 
55 Abschnitte und der einzelnen Strukturgene ("open reading frames" (ORF) 1 bis 14) angibt. 

Fig. 2 ordnet den ORF 1 bis 14 die jeweilige biologischen Funktion (Regulatoren, Enzyme) zu. 

Isolation und Charakterisierung der DNA-Sequenz 

60 Es wurde genomische DNA aus dem Myxobakterium Sorangium cellulosum Soce90, Stamm und Anzucht bekannt 

aus DE 41 38 042, verwendet. 

Genomische DNA wurde mit Hilfe des Qiagen Blood & Cell Culture DNA Kits (Qiagen, Hilden, FRG) isoliert Siehe 

dazu "Genomic DNA handbook" S. 31 ff (Qiagen 1995). Modifizierungen: Nach Denaturierung und Proteolyse wurde 

eine Phenol-Chloroformextraktion, gefolgt von einer Ethanolprazipitation, vorgenommen (Sambrook J„ Fritsch E. E, 
65 Maniatis T., Molecular Cloning, A Laboratory Manual, Cold Spring Harbour Laboratory Press, New York; 1989). Die in 

Puffer geloste DNA wurde anschlieBend auf die Qiagen-Reinigungssaulen aufgetragen und gemaB den Hersteileranga- 

ben isoliert. 



2 



DE 198 46 493 A 1 

Konstruktion von geeigneten rekombinierten Expressionsvektoren 
Expression in Myxobakterien 

Eine heterologe Expression der in Fig. 1 aufgefuhrten ORFs wird unter Verwendung eines Derivats des Plasmids 5 
pSUP102 (Simon R., Priefer U., Puhler A.; Methods in Enzymol, 118: 643-659; 1986), bei welchem das Chlorampheni- 
colresistenzgen durch eine Streptomycinresistenzgenkassette mil Promotorelement aus dem TVansposon TNS ausge- 
tauscht wurde, ausgefuhrt. Homologe kurze Abschnitte genomischer DNA aus dem Wirtsorganismus werden mit den 
DNA-Sequenzen entsprechend Fig. 1 unter Benutzung effektiver Regulationselemente in z. B. die Restriktionsschnitt- 
stelle EcoRI des Vektors ligiert. Nach Amplifikation des Vektors in Escherichia coli erfolgt der Transfer der. DNA durch 10 
Elektroporation der Wirtszellen oder durch Konjugation mit Escherichia coli S 17-1 (Simon R., Priefer U., Puhler A., Bio/ 
Technology 1: 784-791; 1983). 

Mit Hilfe der durch den Vektor vermittelten Tetrazyklin- bzw. Streptomycinresistenz werden die Wirtszellen auf Inte- 
gration der rekombinanten Plasmid-DNA durch homologe Rekombi nation in das Chromosom uberpruft 



Expression in Zellen von Slreptomyces 
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Eine heterologe Expression der in Fig. 1 aufgefuhrten ORFs wird unter Verwendung der bifunktionalen Streptomyces- 
Escherichia coli-Cosmide pKU206 oder pOJ466 vorgenommen. 

20 

Expression von Zellen in Escherichia coli 

Eine heterologe Expression der in Fig. 1 aufgefuhrten ORFs wird unter Verwendung von "Bacterial Artificial Chro- 
mosomes", Cosmiden (z, B. Supercos; Stratagene GmbH, Heidelberg) und T7-Expressionssystemen (Stratagene GmbH, 
Heidelberg; New England Biolabs GmbH, Schwalbach, FRG) vorgenommen. Die Expression rekombinierter Enzyme 25 
erfolgt in Escherichia coli-Zellen, die eine konstitutive Expression einer Phosphopantetheinyl-TVansferase gewahrlei- 
sten, welche fur die Bildung von Holoenzym-Polyketidsynthasen und -Polypeptidsynthetasen notwendig ist. 

30 
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r cCATCGCGGCCCCCTCCCG:TCCTCCTCG^GCGTGCGGtCCAfcCTCCCftCGCCAGCCGCGfcC TTGCCG fcCCCCJGGCGCCCCCACCACCA | 
I ' ' ' ' ' ' " * SP 
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CCACCGCCTTCGCCGAGSGCTCCTCGftCGCAATCCCGC CACTCGGTCGCCAGCTGCCACAGCTCGCGCTCCCGCCCC&CGCAG6GCCTCG 
CCTTCCCCAC6AGCCGT GCCACCGCATCCGGCTCCTCCTKCGGCCCCCAACCCAGCACCCTCCCCGCCCCTGTACCGTCTCGAAGCCCC 
TCGCOAOCACCCTGGCCGrCGCgTCGTCGAGCCGGATCTC CCCCGGCCACAGCCCATCTCGCCCGGCCATCAGCTGCGCGACCCGATCCA 
CCA6CTCGCCCACCCGC AGCC TCG CCTCGACCTCGGCCftCCCCTGTCGCGACGGACACC6GCACGCCTCCCAGCGCCGCCCGCft3CGCG& 
CCGCGCAG7GGGCCCCCCCTGTGCCCACATCCCTGGGCCACTCCGCGCCGGACACCCCGACGAGCCACCACC6C6CTT0CAGCCCATCGA 
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GCCCCCCGCCCTGGCCCGCCQCGATGT CCCGCAGCGCCTCCCCCCGCGCGGCCCCCTCGTCCTCCGAGAGCCTCGCGCC6GCCTCGGCCC 
CGC C6TCTKGGCCfcGGATGACGCACATCACCTTGC6CTCCGCC6TCGTGATCCCCTCGCCCGGCCCCCCCGGCCCCGCG^ 
CCCCGATCCAGAGCCCCTCCCCGGCCACGGCGGCG ^GCTCCGCCCCCGCGGCGGCGCCCTCGCGCGGCCGCTCTCCCGCGTTCTTCGCCA 
GCATCCGCGCCACCAGGCCCTCCfl GCGGCTCCGCGATACCGTCCCGGAGCTCCCCGAGCCCCCGCGGCTCTTCCAGCACCACCCGCATCA 
GCAGCGCGA6CGCGCTGTTGCCGAGGAACGGCGGGCCCCCCGCGAGSCACTCCAACAGCACGCACCCCACCCCGAACACGTCGCCCCGGG 
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CGTCCACCCGCGCQTCCCCGCGCACC1GCTCCGGC GCTATGTACCCGGGCGTGCCCAGCACGGCCCCGGGCGACCTGAGGGTCGGCCCGA 
GCCGCAGGTGGCGCCCC ATGCCGAAGTCC&GCAGCGTGACCCCCTCGACCGCCCCGCCCACGAGCATCAGCTTGCTCGGCTTGAGGTCGC I 
GCTCAACGACGCC6ACCCAGTCG ATCGCCCCGAGCGTCGTCCCCACGCGCGCGGCCACCCCCACGCTCTCGGCCAGCGTGAGC6GCGCCC ^ 
CGGCCAGCCCCTCCTCCACCCrC ACGCCCTCGACCCACTCCATCCCCAGGlACGGCCCCCCTGCGCCGCTCACCCCCTGCGCCACGTACT 
GCACCACCCCGGGCAGCCCGAGC GTCACCAGCGCCTCCGCCTCCCGCCCGAACCGGCCCAGGTCGTTGGCCCTCGCGCCCTGCAAGACCT 
TCACCCCGACCCCCTCCCCGGACAC CCGGTCGCGCCCCCGGTACACGTCCCCCATCCCGCCGGaGACGGCGAGCCGCTCCATCTCGAAAC. 
GATCCTCGATCACATCCCClGCGCCCaTGGCGGTGCCAATGTACTCCGCGCCACCCTCGGGCCCCCCCGCGTAAGTCCCGCCCTCCGCCC 



IS50 
1*20 



GCTTGAACGCCAGCCCGAGCGT CACC6CCTCGCCCTCGGGAKCACGCCCGCCGGATCCGTCCACGCCTCGACCACCGCCTGC6TTGAAC ^ 
AACCCGCCACCGGGCCCACGCAGCC6GCAKGCCGCGCTGGCCACCCCGCCCTGCCCCCCTTACCCTCACCTCCGCCATCCCCCGCTGGT 



co47 III 
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TCAACACGGCAGCTCCCTGCAACCCGCCCGATCACTACATGCTCCCCGCCGAGGAGCCCTTGCCCGCAGrCCCCGAT CTfiGTCGATCCCA 

■ i i . i ._ ■ i — ^ —j- i 

AGCCCTACTTCGTCCTGCAC CCCCCCCGGCAGATCCGCAA6ACGACCTCGCTGCGCACCCTCGCCCAGGATCTCACCCCCCAAGGGCGCT I 

ACGTCCCCGTCCTCCTCTCGGCGG ACGTCGGCGCCCCCTTCTCTGACGATCCCGGCGCQGCCG 'GCICGCGATGCTCCCAGA^TGGwGCC ^ 

CCACCGCCGGCCCGC AGCTCCCCGCCGATCTCCCCCC6CCACCGTTCCCCGATGCGCCCCCCGGTCAGCGCATCGGGGCCGCCCTCCGCC ^ 

CCTGGGCTCtCGCCGCGCCGCGCCCGCTCGTCGTCTTCCTCGftCCAGGCCGACGCCCTGCGCGACG CGACCCTCGTCTCCCTATTCCG CC 
. -\- - . * 1 ■ ' - ■ ■ 1 ■ ■- 1 ' - 1 ' 

AGATCCGCACCGGCTATCCCGACCGCCCCCGTGACTTC CCGCACGCGCTCCCCCTCGTCGGCCTCCGCCACGTGCGCGACrACAAGGTCG 
CGTCCCTCGACAGCCCCAGGCTCGGCACGTC GAGCCCCTTCAACATCAACGTCGAGTCGCTCftCCCTGCGCAACTTCACCCGCGACGAGG ^ 
TCGCAACACrCTACCCTCAGCACACCCCCGAGACCCC TCAGGTCTTCCGCCCGGACGCCGTCGACCGCGCCTTCGAGCTCACCCAGGGCC 
-ACCCGTGGCTCGCCAACGCGCTCGCCCGCCACCTCCTCCAGGTCCKCTCAASCACCGCGCCCAACCCATCACCTCTCCCAACGTCGATC 
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CCCCCAASSAAATCCTCAKGACCCCCAGGACACAC&CCTCCACACCCTCCTGGATCCCCTCCCCG AGCCGCGCATCCCCCCCSTCATCC 
ACCCGATGCrCGCCGGCACCCCCTTGCCGt,GCGTCCCCCCCCflCCACCTTC6TTTCGCGATC&&CCTCCCC CKGTCCGCATGACCCCCC 
AGCCCGGCCUGACGTCGCCAACCCCATCTACCGCGAGATCATCGTCCGCCAGCTC6CGITCCCGATCC GCCCCTCACTCCCCCAGATCA 
ACGCCACGTGCCTCACCqCGACCCCCCCCTCCACC^ 

TCCTCGSCCCCCCCCCCTACCATGfcC&TCCCCCCGCACCTCGTQGTCATCGCCTTCCTCCACCGCGTGOTSAACC CCCCTCGCACCGKG 

ACCCCCAGTACGCCATCGGCCCGCCCAGGATCGATCTCrGCGTTCCTTACGCCGGCGAGACGCTCGCGATCCACCTC^ GGTCTGGCGAG 
*CGGCCCCCCCCATCCCGTC6CCC4GG^ 

TCGACCAGCCCTCCCCACAGCCCCCCATCGCCCACCGCACGCGCCGCGAGCCCCCCCTCTCCCCCGCCGGCCGC GAGGTCCCCCTCATTC 
GCGCCTGAGGGAGCTCGCCCCCCGGCGAGCGCCCTCCACCAGCCCCGGGCCACCTCGCACAGCCTCTCTAC TCCyCCGAGGCCCCCGCGC 
CCCCCGCCCCGGCCGCCGCCCCCGCCGCCGGCTCCflGCTCCCAGCGCACCACC AGSACCTCCCCATCCCCGAGCTCCGGCCGCTCCACGA 
CCGCGTGCGCGCCCGCGCGCACCGCCGTCtCCACCTCTCCCAGC GCCGGCTTCACCCGCGCCAGCGTCGCGGCGTTCGCCCCGaCCCCGA 
GCTCCCTCACGAC6CCCCCCACCCTCCCCCCGAGCTCGCT^^^ 

CCGCATCCGAAGGCGCCGCCtCCCCCCCCAAATCCGCCGCT CAACCCCACTTCGCCCGGTCCATCC&GCTATCCCCCCICTCCTCCGCGT 
jtCACCCACCGCCASACCTCGTCCCr CATCTACGGCAGGACCGCCCCCAfCACCCGCAGCAGCACCGACACCCCCACCCCCAGCCCCCCCA 
CCGCCGA6CCGCGCGCCCCCTCCCC6GCGCCGCCCTCCCCCCGCCCCCGCGCCTTCGCCAGCTCCAC GTAGGCCTCGGrGAACCAGCCCC 
ASftACAAATCCTCGGTCCCCTCGAGCGCCGCCGCGAACTCGTGCTCGTCGAACGAGCGCGTCCCGTCCTCCACCACGGCCGACAG CTTGT 

B 9 III 

GCAAGACCCCCCCCTCGAGCTCCTCG GACATCGGGTGGACCTCCGCCGACTCCCTCAGCACGTACTTGCTCGCGTTCCAGATCTTCG7CA 
CGAGCCCCTTQCC6ATCnCAGCACCYTCTCGTCGAACGCCGTGTCCGTCC CGACCC6CGCCCTCGCCGACCACTACCCCiCCCCCTCCG 

pamHl 

AAGAATACGTGTCGAGCAGGTGCATCGGCGTGACC4CCrTGCCCTTGCTCTTCGACaTCTTCTTCCCATCCGGATCGAGGATCCtCCCGG 
i , ,, , ■ , — > — — . i . . t . i . ^. » . » 

AGATCGCGACGTGGTGCCACGGGACCGACGACTCCTGCAGCATCGCCTTCGCGATCGTGTACaftCCCCCACfiTCCTGATGATGTCGTGGG 
CCTGCGGCCGCAGATCGGCCGGGAAGAGCCGCGCGTGGCGCGCCGGATCGTCCCCCCACTGftCAGCTGATCTGCGGCGTGAGCGAGCTCG 

— - JL. , ■ , f . .1, , ■ I, ■ » I — t . . . . t 

IGAACCACCTCTCGAAGACGTCGGACTCCGCGCTGAAGCCGCCGGCCTGGTCCCCCTGCGACCCCTCGTACCCGGGCGGCACCTCCftCCC 
TCGGGKGACCGGGAGCA7CTCGCGCGTCGCGAGCAGCCCCCCCCTCTGATCCGGGTTGCCC7CGGCGTCCACCCGAT4CCAGACCGCGA 
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ACTGCACGCCGAAATACCGCTGGCGGCTGATGCfiCCACTCACCCTGGAGCCCCTCGGTCCAGTTGCCCtACCCCACGCGCATGAAATCCG t 



U770 



GGTGCCACTIGATC1TGTCGCCGTATTCGAGGAGCTCGGCCTTCTTGTCGGCGAGC C6GAC6AACCACTGCCCCCTCCCCACCAACTC6A 

GCCGCTGGTCGCCCCCCTCCTAGiACTTCACCGCGCGCTCCATCGCCCTCGGCTCGCCCCGCAGCGCCCGCCCCCCCCCCCCCGCCCCCG 
■ — . 1 - ... 1 — - ■ 1 ' - * • » f 

CCTCCTCCTCGCGCCGGACCACCICGACCACCGCCGCGCCCCCCTGC7TCACCCCCCTGCCCTCGAGCGGCGCATACCCGCCGIT6GCCG 
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CC»CC C C t TC 6 C SB CTCTC CCAC 6 CCCCCTCCCC6 W GTCACC 8 GC. C6 ,C.CCGCCGtTCT, 6 CCCAGCATCT C CCCC» 6 CC e » 6 C, | 
TCTGCTCCCGCCACCACMCACGICGGTCGCGTCGC C» t{ GtKAGACCATCAGGUecCCC1 C CCCT,CTCGCG t TCCACG>CCCCc e T 
5 '"GGA t6 .rCCCCACC 6 GCGCGCCCAA e ATCCCCCTC A 6 CCCCC T C,T«CCCAACACC.GCT 6 MACCGCGCGTCCTCCC Ct ,GCGCCG T 
tG.CGCCGACGCAGGCCCC CAGCAGCICCGGGCGCGTCGTGCCGATGACGAGCTCCICCGCCCTCCCCrCCACCGCGUCGCCATGKCT . T 
GGAACCCGCCCCATTCCGGGCGATCCTCCACCTCCCCCIGGGCGACCCCCGICTCCAAAIccCGtCCCACATCGTCCCCCCGAAGACC. 

10 ^^"CSCCCnCt CCTGGAC.TCCACCAACGACAGCTGCGCCCTCeTCCCGCAGrG.rCAICGArGGrCGCCTACTCGnCCCCC 
ACTCGACCGACACGCCCACCCCGCGfiAAGAG CCCCirGAiCtCCTCCTCG?CCTCGCCCGTCACCTTCTGCCAC4GCTCGATGAAGTTGG 
GCCCCGACACGATGCGC GGCCCCTCCTICTtGATCCTCTCCCCCGCGCCCTGCGGCAAGGTCAGGCCCCGCTCGTACGGCGTGCGCJCGT 

" ""^"ACGTGGAAGTAGTICTGCACGCGCCGCICGGTGGGCAGGCCGTIGTCGICCCAGCCCATCGGGTAGtAGATCHCAACCCGC 

CCATCCGGCCCTCGCGG ACGACGACCTCCGrCTGCGTGTACCIGAACACGTCGCCCATGTGCAGCGAOCCCGAGGCGGTCCGCCCCGGGG 

TGrCGACGACGAAGOTCTCCrCGCGGGGCCGCGACGGGTCGTATCGST ACGTCCCGTCGSCCTCCCACACGTrCflrrAficrftrn^rTr r r 
20 ' ' — ' — ' ' ■ . j. 

CGACGCGCGAGTCGAAGTGCTTCGGGAGCGTCGCGGGATCGATCCACCCGftACGTCTfCTTGATCGTCACCTCCTCACCTCC AGAACACA 
CCCCGCAGCAACCGCCCGCGGGGCCGGCATCCTACGTCGTCCCCCG6GTGCCGC7CAAGGCGCGCCGCGCCCGCGCGGCGGCCATCCCCC 



25 



, g 

ATCCCATCCCCGCATCCCCC4CACCCCGCCGCCTCCCCCCCCCCGCCCCCCCCG 



J 10 



TCCGTGGAGCCCACACCACAGGCCCSCGCCCAGQTC 

»■ 6 

Hco47 (It 

gtggagcacccccccggcgccgccgccsic&tcgccgagasgcgggcqc&tccatcgcggccaggcc gggggctcagtcgtasccctcca 

1 " 1 ' ' 1 1 ■ •■ 6390 

CGTGGACCTGCTTGCGGTGGACGCCGACCTCGCCGCGGGCSAGCTCGCGGACCC&CGACACC ATCCGATCCAGGCCGCAGATCaACACCT 
30 ~ ' ' """"^ ' ' ' ' — ' 5fl60 

CCGCCGCC6GATCTCCGCTCTTCTCCGCGAGCTCCCGGTtC&GCTCGGGCACGT GCGCCTGCflCGTAGCCCCGGCGGCCGGCCCACGACG 

GGCCGCCCCCCCtCAGCGTGATCTCGTAGCGGATCCGGTCGCATCCGCGCGCGAGCCCCTCG AGCTCGTCGCGG t AGATGACGTCCTCCT 
35 p 8 n,H, ' ' ' ! 1< * 6 ° 



pamH f .BamH I 



CGAaCCCCCCGCCGAACAGGATCCACACCTG6GGCGCCGCCAGCCCCCCCCCCAGGG4GGCGCGCAGCATGCTCCGGa G CCGCCTCMCC 

CGGTGCCGGTCCCGACGAACAAGGAGCGCCCCCAATCCCC GGGATCGCCCCTGA&C^CCCCGTGCGGGCCGATGGCGCGClfirgTgcrcr 

' ' - J ' 1 ' ' . ■. 6 & 

40 CGGGCTCGAGCCGGTGCAGGTGCTCCGAGCCCGCCCCGCCCTGCACCftCCCTCA CCGCGAGlTCGAA.GCGGGGCGAGCCCTCCCCCCCCC I 
""" * " ' 1 ■' — 1 ■ ■ i , . + 

ATCCCATGGAGTAGGCGCQCTTCACCTCGCCGCCCGGG AGCGGGACCACCAGGTTGACCCACTGGCCCGCCTCCAACAGl&aCGACCTCC 
' " ' ' ' ' ' ' ' 1 1 ' '-- 1 ■ * ■ 1 ■ — -■ » i i 

CCTCGGCGCGCTCGAACGACAGCTCGCGCACGAAAGGGCTClLGGCGCCGGGCGGCGA CGAGGCGGGCTTCCAACCCTTCCGCCTGGATCfe 
TGGTCGGGGCCCGGCCCCCCTCGGCTGCGAGGCCCCGCCCSTCCCCACCTCTTACCGCAGCC TGCGCCCCCCCCCAATCCCGATCGCCeC 
CGCAASGGCGCCGCCCGACCCCCCGCAATCGCGGGAATCfcCCCGCTTCCCCCCCCTGCCCCGCCGGAGCGCCCGCCCCCCCCCCCCCCCC 



?50 
6^0 
6930 
/J>20 

45 " ' * ' ; ' ' ' 7*1 10 

TGG7CGGGGCCCGGCCCCCCTCGGCTGCGAGGCCCCGCCCSTCCCCACCTCTTACCGCAGCC TGCGCCCCCCCCCAATCCCGATCGCC6C 

*— /«:uO ' 

7250 

CCGCTCCCGCGGGGAGCCCTCGCGGGCrcrACCGCACGCCCATC CGCCCGCGCTGCGGGATGTTCACCGCCGGCCCCCACCCArCCTCCT 

50 ' ' ' ' ~ ' ' ' ' ' «■ 7b60 

pamHl 

IGGGGAGCGCCCCCGGCGGCCGGGGATCCCGGTGCGCGSCCTTCTG CGCCGGGAGCTGCCCrCGCTGftGCCGGGCGCTGCTCCCCCCACT 

" 4 ' 1 1 « » 1 ■ ■ — x 7|«70 
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TWCCGACCCCACCGCCWTCCCtW 
GtGCACCCACCCTCAAACAAACCTTCGAA^^ 

CGCGACGCACCCTCCCTCTCTGCGCCTCTCCCTGCTCGCTCGACCGGCGCCCTCTCCACCCAACTCCGCCGTTCCTCCCCiCCCGACGGT 
CCCCCTCGCCCCACGCTCCCCCTCGAGACGACTCAGCGTCrCGACGTCAGGAGAGArGACGACrCGCCCCCTCCCGCCaCGACCC rTCCG 
GC7CGGTCCTTCCAGCGCGCSGCCAGCGACCCACGCGCGATCGCCAGQAGATCACGAATCTCCCGCCCATCGGCCTCCAGCCC CTCCGGC 
TCGTTCCCTC6TCGCCCCGCTCCCTCCCCCCCC6CGCACCACCCGACCTCCCGCGCGGAACCGCGGGCCGCTGTCCTCCCTCCT C 4Tr:f. C 



8 



TACG6TGAG1GCTCCCATG6GTA 



CGACGATACAGGGCGCACGCCGT6CCTACCTCGCCAACAGGCGCTCATCTTCTACCAC GCCCACCAC 
""CCTGACCGTCCGCGCGACCCAGCC^ 

CCACCTCCATCCTGCCCAGCACTTTTTQTCGGGGAGGGCTGCCCTCCCGCTCGCCGCTGGCCQCTCGCCCCTCGCCCCTGGCCGCTCGCC 
6CTGGCCGCT6GCCGCTCGCCGCTGCCCGCTGGCCATGTGCGACCTCACC7CGAGCAGCCC6CGGCTGA C6GACAGACCCCGGAGTTCAT 
CCftCCCCGTGATGCCGAACCCCCCftAGCGAAAAAACGTATCCCTTCGGCAGGTCGTGGCCTATCATCCAACCTGCTCCA TCCGCTCACAG 
GCTTCrrCCAGATCCTCGTCGGTCTTTGCGAAGCAAAACCGCATGAACCGACTCCCCTGCGTCCCTTCAAACAACGCGTCGCCTG GCACG 

cccgccaccccgctctcgtcgaccaactagatggctcgctctccacctctcctcccgggtaggcgagacacatcccccag cacgtagtac 

GTCCCCTCCCCCACGCAGCGTCGCAAGCCCCCTTTCTCCACCGCCCGACACAACCGCTC7CCCTTCCCTTCATATCCCTGS5CAACCCCC- 



7 J60 



7 550 



77<10 



7i30 



7920 
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Si 

BI90 
8280 
8 370 
6(60 
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CTGTAAAACGAgCGAGGAAGGCCGCGGATCCCGGCAGCCACTCCUCCTGCAGCGGCGTCGGCCCGCACACATACAGCAGGTCGCTCATG 



CCTCCAATGGCCrTCCCCCACCTGGCATCGGCCACCCTGTAGCCGATCCGCCATCCTGTC&TCCTCAAGGTCT 



8J20 



TCGAGTAGCCGCCTATC 



GTG4TCGTACGCTCGGACATCCGCGGAAGGGAGGCGACCCTCACGTGCTCACGGCCGTCGAACAT AAAGTACTCGTAAATITCGTCCGTG 
ATCACCATGAGGTCATCCTCCCACCCGAGATCGGCGATCIfCTTCCAGCTCCATTCOGCCGAACACCTTCCCGGAAGGATT TCCAGGAGAS 
TTCACCACCATCCCCTTGGTCTTCGGCGTGATCGCGCGCTCCAGCTCCTCCCCGTCGACATT'CCAGC T CACCCATCCCCCC6TCACATAC 
CGCGGAACAGCCTCGACGGCGAGCATAGCCTGGGCGTGATAGGCATAAAACGGCTCG AAGASCAGCACTTCCTCCCCACCATTGAGCAAC 

pamHI 

CCCATGCAAGTGCCCTGAAAGGCCCCTGTCGCTCCGCCGCTCACCGTCtTGTCAGTCTCCCGATCCGCCGCGATGCCATIATGGCGACCC 



6910 



XX) 
390 



AGCTTCCCCCCCATCGCATCGCGCACCTCCACCATGCCCTCGAAGCGCGAATATCTATTGCACCCCCG*tTCCATCGCCTCCTTCACCCCT 



8 



TGaAGGATCACCGAAGGAACTCCCGTATCACAGACGCCCTGGGACATftTTC ATCCCATGGACCTTGGCGCACGCCACCSTCATGGTACGG 
ATATCGCACTGGGCGAGGCGAGCCGCACGATCACTCGGTAGACTCTTCATCACCGT GCTCCTGCTTCTGTTCTCCGgCTCTGCATGGTCT 
CTTCCGGTGCGCTT6TCAGCTCCACCCCCCCATGCAGCG6CGCAGCCCTA CCGCCCGCAGGTCTGTCCACACTTCTTTCUCftAACCCAC 
ACATTCGGCTTTCCTGCCCrGTTT6CCCGCAGCCCTCCA6CCCCCAGGTA CCCCCTTGTCGGC6GGCCAGATCCAGTACTCCTCTTCCCC 

^Eco47 III 

GTTCACCACCACCTGGCAAC6CQTCTTCCTTTCCTCGTCCCGATTCA1GAT TTTCCTCCCCCTTCGTCAGCGC1GCGCSAGCATGAAACG 
AATCCCTCATCGGCGCACAGGCCCCCCCCGCCTGCCCCGAGGCACTCCCACCCCTCCCTCACGGCAACCICATCGCTCCCGATGTTCCCG 



i do 

9&70 
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DE 198 46 493 A 1 



ATCGCCACTCCCATCGTCTACCTCCCCTGCAGACGGGTATCGCAC*A4AATACCCTCCCCGACTTCTTC4CCTCG7CCAGCACCGCC7CC 

— — — — — * i ■ *— . ■ i ■■■■ ■ «- 1 I i I — M^— I — I — , , | , . ■ 1 I I — — -L 

TTCACCCCATCCAGCTCGCCTTCCATCCACTCTCTCTCTCCCTCGTCCCCCCACCCCATCATGCAAGCGAGCCCCCACCCCCTCATCCGA 

5 AAGCAGACCGTACTCAACCGCGTCGGCGCGAGGCGCTCCCAATCCGGATCGGCGT CCACCCACTCCCCCACCTGCTGCCCCAATCCCACC 
^amH I EcoM 111 

TGCTCCCGGATCCGGGCCGCCAGCCCTTCATGCCCGAAGTACCCCACCATCATC CACAGCTTCACCCCTCCGAAGC6CCSACCCAGCTGC 

10 ArACCCCAGTCCflTCTAATrCgTCACSrC6CCCTCCCTCCCCACCTATTCGGGC ACCAGACTCAACGCCCCCTTCAGTCGGTCGSCCTCA 

CGCACCTAGAGCACGCTGCAATCCATGGGGGTGAACAGCCACTTC T CACGCTTC ACTACCAGCGAQrCCGCCCCCTCCCACCCCGCGAGC 

ACGTCCCTCrCCTCG6GGACGATCGCCCCCATCCCCGCGrAGGCCGCGTCCACC TGAAGCCArAGCCCGTGCTCCCGGCAAACCCT6ACG 

IS ATCGCGCCGATGGCGTCGACCCTCCTCGTGGACGTCGTGCCCACCCTCCCCGCGACGCAGAAGGGTCGGACGCCCCCCCCCACGTCCTCC 
- 1 > » . 1 • « . >. 

pamHI 

ACGACGCCCGCGCGCAGC6CCTCCCCCACCATCCGGAAGCCCCGATC CCTCCCCATCTlCCGCACCCCCTCCTCCCCCftTCCCSAGGGTG 

20 ATSCCTGCCTTCTCGATGGATCAGTCCCCCTGC7CCGACGCGTAGAGTCGCATCCCCCGCTGTCCCGCCATGCCCCGCAGCCCGATCCTC 
' ■ 1 ■ ■ ■ > »■ * - ■ ... i i. i - ■ ...i. 

GGCTCGGCCGAGTCGCGCGCGGCCGCGATCGCGACCATGCTGGCGGTCGACGCGGTGTCCATGATCCCGCCGTGCAAGCCGGCGTCGAGA 

— ... . ■ i- ■ ■ — i.. — i. . i. »-■ i i . , i — -■ ■ i ... , .i « . ■ 

TCCAGCATCTCACGCAGCCACGAGAGGACGAGCTCCTCGACCTCGGTGGCCGCCGGCGJCCTCCCCCATAGCATCACGnGACGTTGAGG 

— »■_■!_-. . . . . 1 

25 ( BomH I 

CACGCCGCGAGCACCTCGCCGAGGATCCCAGGACCAGACG CCGTCTTCGCGAAATACGCGAAGAATCGCGGATGATTCCAGTCCCTCATC 
CCCGGCACAAT6ATClGCTCGAAATCGGTGAGCACGGCGTCCATCGGCTCCGG CTC6ACGGGCGCGGTCGCGGCCACCCT6CCCnCAC5 

30 TC6CCGGGGCCGATC6CGGGAAA6ACGGGGTATCGATCCGGGTGGCCCACGTAATCGGCCGCCCAATCGATCATTCTCATACCGATCCCG 



35 



40 



i mo 

l[)l70 
1 )260 

1 >350 

\mo 

1)530 
1 )S20 
1)710 

1 3800 
1 )890 
13960 
•» 1 1070 



1460 
1250 
1 1340 



amHI 



CGGAACTCCTCCAGATCCATGTCCCCGAGCCGTTCTTTCCGCGGGTCGCTCACCTCtACCTCCTCGCCCTGCCAGGACAGGATCCTCGAG 
' « ■ 1 ■ « . . « . — . — . 1 l ||£|30 

pco47 HI 

CTCCCClGCCTCCGGCGGTGGAAAGCGCTCCTTGAACGTGAAGGCCCACGGGGTCGGTCCGTAGCGCCGCAGCTCCTCGAGCCGATCCrG 



CCCCTCGCGGACG6ACGGGATGTGCCCGGCCGGGACCCACCACACCACGAGGTAATGCGGCTCGAGATGCTCGAACCACCGAGCGCGC7G 



111520 
610 

7CGCAGGAACGCCGCATGA7CCGCGGTGTAGCTCAAGGCGAALAGGTCCTCCATGGAGGTCCA7ACCGACAGGGTCAC3ACGAGCCCCT 

}700 

GTCCGGGTACCGACGGATGGACACAGAGTTCCCCTCCGCCGTCTCCAGGCGCCACACGAACCCCTCGCTCCGATCGCCCAGATGGTTGAT 



IB 790 



jBamH 



ATGGTCGACCCCCTGGACGAAGCCCTCCATGATCGGA7CCTCCAGCCGAGCGCGAATACATGCGAAGTTCTAT7GCCCGA7GTCGTGCCG 
45 ' ' ' ' « l—-— , . . . ■ . ■ ||i880 

^Eco47 III 

ATGCTCCCACATGTCGC7TTCCATCTCCAGCTCCCGCTCACCAATCCCAGCGCT6CTCCGGGCAGCTCATCAGGGCAGACGCGACATCGA 

4 970 

TCCCCA4CCTCCGCCGCATCCCCTCCACCAACGCGGCCTGGACCGCTtCCGCGACGGATCGGCCTGCCTCCGGCAAG4CC7CCCACACAA 
50 . ■ . . ■ . ■ . . . . . : w ^050 

AGAAGAACCGCCTCGTGGAAGGGACAATCTTGCCCCCCTCCGCCTCGCGCCATACGAAGTGCCTCCTCACCACTCCCTCCCCGTCGGCAT 
. . . — — . . 1— . . . . — w ]bi50 
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65 
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Bg) 11 

ACCCCKCTCGCCSGCGCCCACCCCCACCCTCCCGCCTGACCCGACCTCCACCA.CSCCTCACCCCCTCGCC4CATCrCC.CCCC.ACCT 
CCCCCCCAGCCAGAT CCCCCACCTCCCAACCGCCQACCCCCACCCCCAACCCCACCCAC.CC.GCTTCTAAAAATCC.CCAATCCCTTCA 
TCTGCGGCAGCTCTCCA CCACCCAGGACCCCCTTCCCCACCCCCTCGATCCACCTCCCAAATTTCTTCCCAGACACCCCCACTCCCTTCA 
TCCCCTCCCCCCAc e CAGCCACCTCCCCATCCCACTCCCCCTTTTCGTCCCCCCAGCTCCGTCCCA CC TCCTCCT C G.CCTTCCGGtGCT 
CCTCCAGCACGGCCC CCCCCTCTCCCCCCTTGTCCAQCCCTTCCCCCTACCCGGTCACCAACATCATCCCACGAAACCACTCCCACATTC 
CCCCATCCACGATC AATCCCATGTGCCTCCTCCCCCTCGAGAGCGATCCCCTCCATCCACACCACCCTGTGGATCCATCiCCCCCCC CCT 
CCCCACCCACQACCC CCCTACTCATGGCTCTTCCTCCCCCATGAACAGGTCCTCCACCCCTCGATCGTGCTCGGTGCCCCGATCCCTCCA 
CTCCCACCCCCCCCCCACCGCCATCTTTCCACCCGAGACGTACCACGCCCGCTCGGACCCGAGGAACGCCACACCATCTCCGACCTCGCT 



>2«0 
>330 
N20 



CCCCCCCCCCAGGCGGCCCATCC5 



CACGCGCCCCTCCATCCJCrCCTTCTGCCCCCGCCCAACCTATCCC 



TTCTCCATGAGCCCTCC4CA 



CACACAGTT6ACCACC ATTCCATGAGCCGCCTCCTCCGTGGCCACGCTCCCCCTGAGGATGAGCACCCCCGTCTTCCC6ATCGAGTACCC 
CCCCACCTTCCCCGCG CCCCCCATCCCGTACGTGGGGCTCAACCCGATATTGATCATCCCCCCCCTCTTrCGCTGGCGCAlcCCCCCCAC 
CCCCGCGCGACACACC TAATGAACGCTGCTCACGTTGCTGTCCATGACCTTGCCCCATTCQTCGTCCCTCATCCCCCCAAG CGGCTTGAA 
CAACAAGTCCCCCACCTTATTCACGAGGATG7CCATCGCCCCCACCTCCCCCTCC 



ACGCTGGAGAAGAGCTCCCCCCCCGCGTTGGGGCG. 



CCTCACCTCGGCCTGC ACCACCATGGTTCGTCGCCCGACCCCCCGGATCTCCCCCCCCCTCTCCTCCGCCCCArCCTTCTTCCAATGGTA 

ATTGACGGCGACGTCC GCGCCTTCCTCCGCCAGGCGCAGCGCSATCGCCTT6CCAATTCCGCCCCAGCTACCGSTCACCAGGGCCACCCC 

CCCGGCCACCTCCACC GATCGCCCCTGTCGCAGGGCCGCACCAGCCTCCTGOTGGAGCTCC.CCTCGACGGGGAGCTCCACGTCGTAGCT 

CGTCTCTCCCGGACC CGCCCACTACCTCTCGTACAACCCCTCGAGGACGGGCTCTTCCCGTC6CATGATGTCCGCCTC5CATTCGGCGCT 

GCGCCACCGATAGAG CACCACCATCTCGTCGGCCCCCACCCTGCTCTGAAAGAATCCCCCATGACCCCACCACCCCCCCTCTTCGTCGCC 

TCCTCGGCCGAGCA GATCATCCATTTTTTCCATCATCTCCGtGGCCTCCCCCTCCATGCCGGGTTTCATCCCCCATCGCTCCATAACGAG 

CATCATGTCTrCGCTC CrCTrCGTCATCCCCGTrTCGATCTCGGGGGGCTGCCCGCGCTCTCGACCCCCCGCCCCTTGTAnGGCCGCGC 
peo47 III 

ATGGTCTCCCTACCGC TCCCCAGCTTTCGCTTGTGCGCCCCCTTCAGGCTTGCGCCTTCATTGACGAACCGCTCCCAG^CAATCCGrCC 

cattcatatgccct cccgagcgcccacagctagagacgctgcctaccagcgagcttgggcccaagcgccctcaaggcgsstccgatccat 

TTGAGGGTGCCAAT CAAGCGGGCGTCCTCTTCGAAGAAGAGACCCCrCAATcCATCCTCGACCAACCGCCCCCCCATG^AGGTCCCACC 
ATGTTGTTCTAATCATCATTCGAGAAATCGCCGGTAAACCGCAAAGATGCCGCCGTrCCCCACCAGAGCTGCGTGGAGlTCCCGAGC fiC C 



16510 
>500 

tbso 

>7so 
12870 

>960 
I 3050 

HHO 

3230 
1 3320 

1 3500 
3590 
3880 
3770 
3860 
3950 



•GAACGCG 



TCTCGCGCCCTCGCAACGTCACCGTTCCCCAGCCCCTCCGACAGCCACCTGTGCGCCATGAGCAGCCCCTGCACC^CKGAj 
TCAfGCCCCAATAC CCAGCGGCCCACCGCGCCGTCCGCAGCCCCCGCCTCCGCCGGAGGCCCACCCACCTGCGGGATGCCATTCCATCAT 
ITTGGCCTTCCCTTG CCGCACAACTGGTGGAGGATCTCCTCGATCGACGCACAGACATCCCCCATTTCCATGGGT1GCAGGGAACTACCT 
TTCAGGCTTTCCCGG ATCATTCGCTAATATGCGACGATCACCGCTTCGCAGTACCrCTCCACCCCCTCTCCGGCGGAGACcCGCTCCACA 
TGGAAATAGGCGTCGTACTCCCCCTCCCGGTCCGACAGCCTCCCCGGGATGTCCGCATCTGCCCCTTGCCCCTGCCATCGCTCCfccez.Tc 



1040 
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CGCACG CCCACCCfiGGCGAGATCCTCCGCC^CACCCCCAGGTCGCCCKCGCCGCATGCGCCAAC^G^CTCGAAGGCCTCGQCTCCC I 
ACCTTCGAGGTCTCCCCCATTCCCACGGCCTCQATCGCTTCCCCCACCGGTAGATCGMCGTATATTTAGCCATCATTTCCCCGAAGUT ^ 



1940 



GCCCCTGCG TCGACAGATCTTTCCCGftGCCGGAACGCCATTTCCACTGCTCTGGCTCTCAATATTGAAl TGAGCCCTGCCCACTCCCAiA ^ 
GGCCCAGTCCCTCCACACAGT6TACCGACCCCCCCGATGCTTTCTCCTTTTTTACTCCTGCACCGAATACTTC7CTTCCGCCCCAAA6AT 



i030 



*«1 

cccttgcccaga ctgtcccgccagatctcgtgtccgaagcgtccccacgtccagcgggcccatgccttcctac^gcataaaaccgttcca i ^ 

IG CCTGGTCCAGAGSGAOACGCCACCAGCCTCCCTfTeGOACGGATCAGG/ATTTCCTCACCCAAATGTCCCCACGAACAGCGGCGCAGA ^ 
AGCGGCGC ATCGATGGGGAACCATGGGTTACCftAGACATTGATGATAUGTCC&CGCAATCGCAATCCTCGCGATC^CCCCCGCTrCCC 

cgccc ccacaaacgtccagcagctgtggcaoaagctcccccctggcgtggaatgcctcgtcaccttcacagaggccgaggcgctcgcccc 

GGGGGTCAGCCG CGAGATGCTCCCCAATCCCAGCTACGTCCCCACAGGCGCGCCGCTCGACGCCGTGCAGCTCTTCGACGCCTCGTTCTT ^ 

pamH I 

CGGGT TCAGCCCCAGCGAGGCAGAGAGCATCGATCCGCAGCAGCCCATCTTCCTGGAGGTCGCCTGGGAGGCCCTCGAGCGCGCCGGTTA 

CG ACCCCGATGCCCATTCCG6GCCTATC6« , 5750 

CCTAG GCGCCCTCGGCC ACTACCAACTGACGCTGAACAACGACAAGGATTATCTCACCACACACCCCTCGTAC AAGCTCAATCTGCGCCG . ^ 

CCCCAGC GTGTGCGTGCACACGTCCTGCTCGACCTCGCTCGTGGCCGTGGTCATCCCCTCCCAGAGCCTGCTCAACCACGASTCCGACAT ^ ^ 

nRrr.rTCCCCGGTGGCGTGGQGflTCCATGCGCATCAGCCC& CCCGCTATCTCTATCAGC&G&ACGGCATCTCT TCGC CCGATQGGCA7TG ^ ^ 
1 ... 1 -- ■ — — *■ * 

CCGCGCCTTCCftTGTG GCCSCCAiGGCCACCGW^ U U0 

± U200 



5390 
1 iQBO 
1570 



CGGCGACCACCT GCACGCGGTGATTCCAGGAGCGGCGATCAACAfcCCACGGCTCGAGCAAGlTCGCTTACACCCCGCCGASCGTGCAGGG 
GCACCCCCAGGTGATCGCCATGGCCCAGGCGCTC CCCGGCGTGGtGCCGGATCaCATCAGCTACATCGAGGCGCACGCC^CGGGGACGCC 

GCT 



1 i29 ° 

CGGCGATCCCATCCACATCGCAGCCCTCACCCGCCTGTTCCGGGCCAftCACCCCACGAAGGCAGTTCTGCCCCATCGGCTCGCTCAA ^ ^ 

CftC CAACCTCGCCCACCTCCATGCCGCCCCCGGCGTCCCCTCGCTCATCAAAACGGTCATCGCCCTCCACCA CCGCGAGCTGCCCCCGAC ^ ^ 

CCTGCACTTCGAGCGTCCGAATCCCAAGCTCGaGCTGGAGAGCAGCCCTTTCTACCTCftACACCC6CCTCACTCC GTCGCAC6CGGCACG I 

AGGTC CGCGCC6CGCTG6CGTCAGCTCGTTCGGCATCGGCGGCACCAACGCGCACCTGGTCCTCGAA6AAGCTCC CCCCCCGCCTCC6AG ^ ^ 

CGGCCCC TCGCGGCCTTGGCAGCTCCTCACCCTCGCCGCTCGCTCCGACGCCGGGCTCGCGCGGGCCACCGCCGftCATGATCGftGCACCT ^ ^ 

CGATC GCCACTCCGGCACATCGATCCCCC&TGTCACGTACACGAGCCACGTGGGGCGCC6GCCCTCGCCCTTCCGGCGAGCGSKGTCGG ^ ^ 

CCACAGCGCCGCGGMCTCCCCCCCGCGCTCC CCAGCGAGGGCTCGCCGCCCTCGATCTCCTCATGCCAGCCCGC C^GGIGAGGCCCCT ^ 

1 1 1 * ~" 1 " 1 

CGTCTTCCTCTTCCCC6GTCA6GG&GCGCAGCACCTCTTCA7CCCCCCGGAGC TGTACQA.CGTCCACCCCMCT T CCGSCASTCCCTCCA \ 

CCCCTGCGCCGAGCTCCTGCGCGGCCCGCTCCCCCTCGATCTGCGGCACCTCCTCTACCCCGCCGAGGGCCA CCCCC^G^CGCCGAGCA ^ ^ 

CCAGerCGCrACCACCGCGATCGCCCAGCCCGCGCTGTTC CCCATCCACCTCTCGCTCGCCAAGCTCTGCAT CCC CTCSGG6ATCGTCCC ^ ^ 
T « • ' 

cct6sccATctTccecctCAGccTCCccc*euc6cc5ccGci»cKicccecccAtcTTccGC6AAc.ecACcccc »c«ccTC6TCcc t |2so 



10 



DE 198 46 493 A 1 



CGAGCQCGGCCCCCIGATGCA ACAGATCCCCCCCCCCCCCAI6CTGGCGGTCCCCC TCGCGGAGCCCCA6CTCCCCCCCTACCTCACCCA 
" " " ' 1 1 1 — ' ■ ■ 1 1 1 i 

CGlCATCTCeCTCCCCCCCATCAACGGTCCOGCK^ 

GGACCACGCCCTCTCGTGCCGGCGACTCCACACGCGGCACGCCTTCCACTCCAAGATGATGGCCCCCCTC CTTGACGCCTTTACCCCATC 
CGTGTCCCCCGTCGAGCCCCGCCCGCCGTCACGCCACTTCCTCTCGACCCtGACGGGCGGCTCCATC TCCCCCGftAGCAGCGACCATCCC 
CGCATACTCGGCCCGGCACCTCCTGGAGCCCGTCCGCTTCCCCCAGGCCGTGACGCACCTCCT6TCCGA GTCGAC6TGGCTCTCGCTCGA 
CCTCCCTCCGGGCCAGACCCTCAGCCCGCTCCTACCGCAGCtCCCCCCCGCGGAT GGCGCCCAeCTGGTCGTCGCCTCGCTGCCCCCCGC 

,Eco47 III po47 III 

GAAGCACCCGGGCGCCGACCACCTC6CGGTCATCGAGGCGCTCCGCCCTGTCTGGAGCCCTCGTGGGACGGTCGACTG6AAGCCCTTTCA 

p«>47 HI 

CCAGGGCCACGCGCGGCGGCCGGTGCTGC7ACC GACCTACCCCTTCGAGCGGCAACCATACTCCCCCTCTCC6CGCCACACGAGCCCTCC 

' ' 1 ' ' ' — ; — - — ■ ■ 1 ' ■ ) 

JBamHI • 

GCCGCAAGCCATAATCAAGCCGCTCCTCGCGAA GAACCCAAACGTCGCCGATTGGTTCTTCCTCCCTGCCTGGCGCCCCTCCGATCCTCC 

' ' ' 1 1 — 1 — « ' ' ■ 1 1 

GGTCrCCTTCGACeCGCAGGCCGTCACCACCCecccCTCTACCTGCCTCGTCTTCATCGCCGACgACGGCCTCGGCGCGGCGCrCGTCCA 



17370 



lVq60 
550 
lU<10 



£a*7«l 

CSGCCTCGCGCCCCCGGGGCACGAGGTCCrCCCGGTGGTCAC GGGTGAGAGGTTCGAGCAGACGGGCACCCAGCGCTACACCATCGATCC '• 
CGCCGCGAATCGCGATGTTGCGTCCCTCTTCGCGCGGCTCG^AATCCAACGGCG CATGCCGGACCCCATCCTCCATGCCTTCTGCACGTC 
GCCTGCGGACGGCGCGCGCATCGAGCGCGGAGCCGCGCTGGAG4TCGAGCGC&GGCTG GGCTTCGATAGCCTCCTCCTCCTCGCCCASGT 
GATCCCCGCACAAAOGCATCCGAAGCCGCTGATCCTCGGCGTGATCftCGACCCGGGCGCACTCCGTCATC CCAACCGAGATCATCGAGCC 
CCTCCGCGCTCTGGTCCTCGCCCCCTGCCCCGTCATCCCGC&ASAAATACCCC ATGTCTCGTGCCCCAACATCGATATCGATCTCCCCCG 
CGAACGCGGGCGCGCGCAGATCGCGGCGCGCCTGAYCGCCGATCTGGAC CCACAGTCGCCCGACTCGGTGCTCCCCTACCGCGGCGGCCG 
GCGCTGGG7CCACAGCATAGAGCTCACCGATGTCGGCCGGCCGTCAGCTGGCGCCGCCCCGCCCC TCCGCCAGCGCGCGGCCTACCTCAT 
TACCCCCGGCCTGGGCCCCATCGGCCTCCTCCCTGCAGAGCTCTTCGCCCCAGAGGCGCACGCACCGCTCATCCTGGTTGGGCGGACfcCC 



17730 
1 7B20 

rs\Q 

5000 

1090 
1180 



16270 
1 >350 



J530 



pamHl 

CCrGCCAGCGCGGCAGGGGTGGGACGACT GCCTCGCGGCGCACCCCCCCGGCGACGCGACCAGCCGAAAGATCCTCCGCATCCGCCCGCT 
1 « . i ■ --■ ... ... i i i . i i . . i i ... . — i . . i . ♦ 

CGAGGAGGCCGGCCCCGAGCTCAAGATC6C CGCGGCCCACCTC1CCGATTTCAATCCCATGCGGAGCGTCATCCACCACCCCCGGACGCC 

CTTCCCCCGCATCGACCGCGTCATTCACTCCGCCGGCAKGCGA GTGGACCCATGATCCAGCTCACCACCCCCATGGCGGCTTGGCGCCT 

GATGCCCCCCAAGGTCGGCCCCACGCTCG|GCTCGATGCCCTCCTCCGG6ACGAGCCTCCCGACT TCCTCCTGATCTCCTCCTCGTr6gC 

CTCCCTGGTCCCCCCCGCCACCCACATCCATTACTGCGCCCCC &ACGCCTTCCTCCAC6CCTACGCGCAGAGCCGC0ACSCCGAGGAGGG 

ATGCCGCGTCATCTCGGTGCAATGCGACACGTGGAGTGACCTCCCCATG CCGGTGGACTTCAAGCTCCCGGCCGATCTCCAACACGCGCG 

CCGCGAGAC CCTGAAGCGSGGCATCAGCTCGAGCGAGGCCCCCCACGTGCTCGGCCCCATCTTCACCGCAGGCATGAGCGGCCCCCTCCC 
* 1 ' - 1 ■ » - • ■ * ... . 

GATTTGCACGTCGGATCTACCAGCGTACAAGCACTCTCTCACGACACGCCCATCCCACCACGAGCAAACTCCCGCCCCCCGgCCGArGCA 



1 JS30 
1720 
J8I0 

1 !900 



1990 
'080 

ifeno 

19250 
19350 

qqo 

1*530 

>620 
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5 
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15 



35 
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CTCCCCCCCAACGACCACCCCiCCCTATCTCGCTCCCCAOiCCCACACCGAACeCCGCATCCCCCCCATCtCGCAGGlTCTCCTCGGCCT 
' ' ' 1 1 ' ' fc 16710 

CGAGCAGGTAGGCGCAAACC1CCATTTCCTCCAGCTCGCCCCCCATTCGCTGTTGGCCACCCACGTCCTGTCTCGCGTCCTCCAC4CCCT 
' ■ 1 ' ' ' •> lb 300 

CAAGGTCGGGATCTCOTTGCCGCAGTTCf TCGATCCGCC6AC6GTCGCAGGGCTTTCCCGCCTGGTCGACGCACCtCGG6CCGAAGGCCC 
' ' ' « ■ ■ 1 ' ' ' ' ' ' »» 1&890 

CCCACCCGTCGCGCCCGCAAICGGCCGTCTCGASCCASACCCCTACCGAATCAAGCCCCCCGCGGCCGAACACCCC6CCC6CACCAAGCC 
' ' ' » 1,1 ' 1 »• 1&980 

GTAACAAGAAGGGGATCGACTCATGGAACCCGTCGGCGCCGtGGACATGAATCACCCCGCAAAGCAGCACCACACCTGCGTCTTCCCOAC 
' ' 1 — ' ' ' ' ' ' -2 



CTCCTTCGCGCACCGGCGGCTCTGGTTCCTCGACCAGCTC6AGCCC GGGAGCCCCGTCTACAACATGCCCGCCTCCTTCCGCAC6CCCGC 
CCCCTACGACGTCGACTCGCTCGTGCGCAGCGTGAACGACATC6IGCGGCGCCACGACTCGCTGCGCACGACCGTCGAT6TCATCGATCG 

— — 1 ' 1 1 1 1 I ■ ■ i 1 ■■■ i i i , i i . i ■ I , 1 . . . ■■« ,K 

CGAACCCGTCCAGGTGATCGCCCCCTCGCTCCGCA TCGAGGTCCCC6TCCTGGACCTGAGCGAGATCCACGAGCCGGAGCGAGAGGCGGA 

CGCCC6GCGGCTCATCCC6GAGGAGA6CCGCCCCCCCTTCGATCTCACCCCACCCCCCCTGC7CCGACCCAAC CTCCTCCGGCTCGGCGA 

GGCCGATCACGTGCTGATCTTGACGATGCATCATATCCTCTCCGACGGCTGGr CGATCCACCTGCTGTTCAACGACCTTTCCACCCTCTA 

CCCCGCCTTCCACCACGGCCGCCCGTCGCCCCTCCCGGA6CTGCCGATTCAATACGCCGACTTCGCGGTGTCCCiCCGG6AGCT6CTCCA 
20 ' ' 1 1 ' ' ' ' 1 1 1 1 1 ' 1 * 2 

GCGCGAAGTTCTCCAATCGCACCTCCQCTACTCGAGAGAGCACCTCCGCCCC6CCCCCACGCTGCTGGACCnCCGATGGACCGGCCCCG 
■ - ■ - i .... . i . i . ..-».- . * 

GCCGCCGGCGCACACGTTCCGGGGCTCCCACCGCGCGTTCCGACTCCCACTCTCCCTGCAACAGCCGCTCCAGGCGCTCAGCCGGCAGGA 
' ■ « ' ■ — * ■ ' ■ ' ' ' «• 2 



)070 
)150 
)250 
>330 
2)430 
21)520 
)610 
)700 
)790 

AGGCGCGACCCCCTTCATGAC6CTGCT6ACGGCGTTCACCCTCCTGCTCTC6CGTTATGCGCCCCAGAGCGA1CTGGT6G7TGCCACCCC* 
25 ' — 1 ' 11 1 1 ■ * ' 1 1 ■ L 2b350 

CATCGCGAAlCGCACCCGAGCAGAGCTGGAGGGGCTGAKGGCnCTTCGTCAACATGCTCGCGCTGCGCATCGACCICGCGGGCCACCC 
■ 1 - 1 ' 1 ' 1 « ' ' ■ 1 ■ ' *• 2&370 

GAGCTTCCGCCACCTGCTCGGGCCGCTGCGGGAGGTGACOTTGGGCGCCTACGCGCACCACGACCTCCCCTTCGiACGGCTGGTGaAGGA 
' ' ' ' « ■ • ' i ' ' >- 2hO60 



GCTGTCACCAGGGCGGAGCCCCAGCCACAGCCCCTTGTTCCAGGTGTCCTTCACCTTGCAGAACACCCCGATGGiTGCGACGAACAGAGC 
30 ■ 1 — « 1 — - — • • . 1 , i «. 2 



AGACATTGCATCGGGTG GCCCGCCGCTGGTGGAAATGAAGGCGGCGAAATTCCATCTGATCCTGGAGCTCTCGCAATCCCCCCAACGGTT 
GCTCGCCACGUCGAGTACAACACCGACCTG7TCCACGCCGG CACCATCGAGCCGATGGCCGGCCACCTGGAGGTGCTCCTCTCCAGCGC 
CGTCCCGCCCCCGGATCGACCCATTGCGGAGCTGCCGCTCATGGGGGCCGAGGAGCGCACTCGGGTATTGGTGGiGTGGAACTCCACTGC 



150 
1240 
211330 
420 



CGCCCTGTATCCCGACCACCATTCCATCCACCACCTGTTCGAGCAGCAACTCGAGCGGTCGCCCGAGGCCACCGCGGTGCTCCTCCAGCA 
■ . ' ■ • . — • . . . . , ». 2)5\0 

GCAGACGTTCACGTA1CGAGAGCTCAACATGC6CGCCAATCACCTCGCGCATCACCTGCCCACCCTGCGCG7GSGCCCACAGCTCCCCCT 
■ ' ' ' ' ' ' ■ 1 1 2fr6G0 

40 cgggttctatctcgaacggtcaatcgagacggtcgtccccatcctcggcgtgctc'aacgctcgcggggcctacgtg:ccctccatcccac 

i • — ' *~ ' ' 1 ' ' ' *■ 216S0 



6TACCCCACCGAGCGCCTCGGGCTCATGATGGC6GACGCACCCCCCTCGGTGCTGCTCACCCACCCGTCGCTCCTCTCGAAGCTCCCCCC 
— — « > ■ ' ' ' ■ ■ » ■ ■ ■ ' 2 

^co47 til 

45 CCACGCCCATGCAACGCTCCTACAGCTCGACGCGCTCCACCAAGCCCTCTCCAGCCTCCCACACCATACCCCGCGGACCCCCCyCACCGC 



760 



370 



CCAGAACCTCGCATACGTCATCTACACTTCCGGCTCCACCGGGCGGCCCAAGCCCCTCCKGTCGAGCACCGCG5CCTCTGCAACCTGCC 

— 2J9S0 

CACCGTGCAGGCCAAGCTCTATGGAATCGCCCCGGCCGACAGGCTCCTCCACTTCCCCCCGCTCTGCTTCCACiCATCGTTCTGCGAGAT 

050 

50 CCCCCTCGCGrTCCTClCGGGAGCGACGCTGGTCATGGGCACGCCCCACGAGtlTCTCCCGGGACCTCCCCICCTCGAGCTGCTGAAGAA 

2$ 140 

JEa>47 lit 

GCACGCGGTCACCGCGATGCTCCTGGCCCCTACCGTGCTCGCACCGCTGCCAGAACAACAGAGCCCCCCCTTCCCGC1GCGCGTGCTCAC 

22230 
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peo47in 

CATGSCCCGTCAGCCGTOCCCCCCCCAGCTCGTCAACCCCTCCAACGCACCCCGftCCCCCCCTGnCAA CTCCTAtCSCCCCACCGAGftC 

GACCATTTGCCCAAGCTCCGCAGCGGACCTCTCCGACGAACGGATCCCCCCCATCGGCCGTCCCATTGCCA^TA CGCAAATCTACCTCCT 

|Eco47IU pg!|| 
CGACGAAGC6CTCCAGCCGGTGCCCATCCCCGTGCCGG6CGAGATCTTCATCGGC6GCCT6GCCGTCGCCCGGGGATATCACGGGCGTCC 



25320 



2 2310 



2500 



CGACCTCACCCCCGAGCCATTCCTACCCGACCCCTTCCGCCAAACCAAAGGGGCGCGCCTCTATCCG4CCGGC6ATCGG5CGCGCTCCC1 
• ' « ■ ■ ■ ■ — 1 . 1 , l 2^590 

GCCCCACGGAAACCTCGAGTTTCTCGGTCGAAACGACGACCACGTGAAGGTCCCCCGTCTCCGCATCGAGCTCGAGCACATCCCCGCGGC 
■ « ■ ' ■ ■ 1 ' 1 — ' 1 ' ' 2&6B0 



STTGCTCAAGCACCCGGCGGTCGCTCAAGCCGTGGCCG7G GTCCGCGAGGACACGCCCGGCCACAAGCGGCTCG1CGCGTATGTCCTCCG 
ACCCCGAGGAGCCCCCGTGACCGCCGCCGACCTGCGCCAGTCCGTCAGCGA 6CGATTGCCTGCGACCATCCTCCCATCGTCCTTCGTCCC 
CCTCGACCCCTTGCCCCTGACGCCGAATGCCAAGGTGGACCGCCCCGCGCTGCCGGASCCCGAGCACACCGCCG6CGGC6AGGACCACCT 

— ' ' ■ - — --^ ' ■' ■. ■ *- ' ■ I ■ 1 . « 1 L 

CCCGCCGCGCAACCCCGTCCACGACCACCTCGCCAGGATCTCCCCCACCGTCCrcCGGCTCGAAACC GTCGGCGTCCACGACAACTTCTT 
CCAGATCGGCGGCCACTCGATCCTGAGCATCCAGATCGTGGTGCGCCCGCAGCAGGCAGGGCTCCCCCTCACCCCGCGTCAGATG7TCCA 



GCACCAGACCATCGCCCAGCTTTCGACCGTGGCTACAGCCGTCGAGGCG6TCCACGTCGAGCAGGACCCGGTGACC6GTCCCGCGCCGCT 



pco47 111 

CACCCCCGTGCACCGCTGCTCCCTGGAGCAGGAGCCCGCCGAGCCGCACCACTTCAACCAGTCGATCT TCCTCGAGCTACGC6AGCGGCT 
CGACGAGAGCGCGCT6GAGCAGCCCATCGCGCATCTCATCGACCACCACGACGCCCTCCGGTTGCGCCTCGCGCCCCACGAACGCGGCGC 



2 2770 



226S0 



29 50 



2 WO 



J130 



23220 



2G310 



2?«J00 



CCACCAGGTCTTCGCCGCGCCGCCAGGCTCGACCCCATTTCA GCGCGTCGACCTCGCCGCGCTGCCCAGCCCCCACCAGATCTCCGCCAT 

GGACAAGGCCGCCAGCGAGGC6CAGGCGAGCCTCGATCTGGCCGCGGGCCCGGTCGTCCGCGCCCTGCTCTTCCACCTCCCCCAGGTCGC 
— — 1 . — ■ i ■ 1 , t . . . . i . r 

CCCGCAACCGCTCCTCGTCATCCCCCACCATATTGCGGTCGACAGCGTCTC CTGGCGGATCCTGCTCGACGATCTCTTTCCCGCCTATGA 

pco47«l 

GCAGGCCCCCCCCGGCGAGGCCGTACCCCTGCCGCCCAAGACCACCTCGGTCAAGCCCTCCGCCGAGCTGCTCACCCACCACCCCGGCtC 



2MS0 



2 3580 



2^670 



29760 



CGAGGCCGTCAAGGCGGAGCTCGCCTACTGGCTCGACTCATCGCGACGAACGGTAGCT CCGCTGCCCGTGGATCGACCgCCCGGCGAGGA 
CGTGTGGGCCTCGGCGCGCCACATCG7CGTCTCGCTCACGCCGGftGCAGA CGCAGCAGCTCCTGCGCGACGTCCCCCAGGCGTACCCCAC 
ACGGATCGACGACGCGCTCCTCACTGCGTTCCCGCAGGCCATCGCTCCG7 GGACGGGCTCGCCCCCGGTGCUC1CCACCTCCACCCTCA 
CCGGCGCGAGGAGCTCGCC6GCGTAGACCTCACGC6CACQGTCGGCTGGTTTACGGCCATG7ACCCGATCCTACTCCGCGTCGACG CGGC 
jBamH I 

SGATCCGG6TGAGGCCCTCAAATCGATCAACCA6CAGCTCCGCCCCGTGCCAGGCCGCGGGCTCGGCTACGGCT TGTTGCGTT ACCTTCC 
GTCCGATACCATCGCCGAGGTCCGCGCCTTCCCGCAGGCCGACCTCTCCnCAACTA CCTCCGCCACCTCGATCAGGCGATCCCCGACCC 
TCCACCGTtCCGGCCCGCGCGCGAGTATCAAGGCTCGGAGCGCACCCCCCGCGCCCATCGCGCCCtCCTCATCCAGGTGAACGCGACCAT 



2 1650 



2«030 



2^120 



2 210 



2 300 



2 390 



10 



15 
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30 



35 
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45 



50 
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60 
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13 



DE 198 46 493 A 1 



CGCCAATGGCCCCCTGTACCCCACCTGCACCrACAGCGACCGCCCCCACCAGCCCGAAACCATCCtGCGCGTCCCGCCCACCTTCGTCAC I 

' ■ ' — — — — 1 ■ 1 1 1 ' » ■ » 2Hqao 

CCCGCTCCCCCCCCTCATCCCGCACTCCACCTTGCCCGAGGTCCCCCGCAACACGCCTTCCCACTTCGACAtGGTGCCCCTCCCCCASGA 
' ■ ' ■ • . — 1 . . • ' 2U570 

5 GACCATCGATGCTCTCGACGCAATCCACGCGGGCCCCGGGCCCTCTGCGAGGGGGAGCCCiAKCAAGACGTCTACCCGCTCTCGCCGCT 

■ ' ■ ■ • i . 1 ' 1 ' 1 ' 2|<56Q 

CCACGACGGCATCCTGTTCCACACGCTCTAC6CCACCCATT4CACGGCGTATGTCCAGCACTTCCACTGCACCCTCGAGGGCGATTTCCA 
■ »— ' ■ ' . . . . . ^ 2 |l750 



CCCCGAG6CGTTCACCCCCGCCC7CCAQGACCTCCTCCCTCGGCATGCCGCCCIGCGCAC6TCGTTCGCCTCCGAGCGCCTCGATGCTCC 

2 



10 ACTTCAGATCGTCCCCACCCGCGCGGTCCTCCCCCTCCAGCACCAG CACCTACCCGGCCTCGCCGCGGAGCACCAGACCGCGCACATCTC 
CCCTTACGTCGAGCCAGAGCGCCACCGCCGGTICCATCTCCGAAAGCCGCCCC TCATGCGCGCCCGCCTCCTCCCGCTCCCCAAGCACCC 
CTCOTCCCTCGTCGAOACCATCCACCACCTGATCCTCGACGGCTGGTCCACACA AATCTTGCTCAAACAAGTGTrCACGCTCTACCACCC 

15 GCACCCCGCACACCCTGGCCATCTC6CGCTGGAGCTCGAGCAGCCGCGCCCCTAC GGCGATTACATCCCCTGGCTC6CGAAGCAGGACCA 
CGTGCCCACCGC66CC7TCTCGCGCCGCGAGCTCCAGCCCTTCTCCGCGCCGACCCCCCTCGGCGTCGACCGCGCTGTCCCGCACGACGA 



20 



25 



30 



35 



40 



45 



50 



55 



CGGCCCCC CGCGGT TTCGTTCGCGCCGCATCGCCCTCTCGGGCGACGACCCCCCCCGGCTCGCCCCCTTCCCCCGTCACCATCAGCTCAC 

GArCAGCACGCTGGTGCAAGGCGCGTGGGCGCTCCTCTTGTCAC6CTACACCCGCGATCCCGACGTCCTCTTCCGTATGACCGTCTCGGG 
i ' ■ 1 ■ - - - • , * 

CCGCTCGGCGCCGATTCCtGGTATCGAGCGCATGACCGGCCTCTTCATCAACACCATTCCGGTGCGCGTGCGCCACCCTCCCGACCCGTC 



18^0 
1930 
5020 
2>U0 
26200 
1290 
i380 
2?170 



GGTGCTCCCGTGGCTCAAGCCGCTCCAGGAGCACCACGCAGAGCTGCTCGAGCACGAGCACAGCCCGCTGCTCGiGGTCCAGGCCCATAG' 
- « ■ « ■ . . ■ . . > , • - 2^650 

CGACGTGCCGCGCGGGACCCCCCTCTTCGAGAGCCTCGTCGTGTTCGAGAACTACCCCCTGCASGTCATCTTCCACCCCCCTCCGGTCCA 
1 . « ■ . . 1 . . : ■ 1 . «. 2 ^ 7 q 0 

CCGGCCGACGCCCCCGGAGGAGGGCCTCCGCATGATCGATCCCCAGTA7ATCAGTGATCCACCGTATCCGCTGACGGTCGTCGCCGCCTT 
< ■ « ■ u-: . . . . 1 . . .. 2 fc fl30 

CCA7GGGACGCTTTATCTCAATATTGGCTACGAGCGCCGCCGGTTCGAC6ACCAGGCCGTCGA&CGGATGATCGGGC ACGTCACGACGCT 
• « ■ • i 1 1 ' ' ■ ' ' ' • ■ 2 J920 

GC7CCGGGGC77CCTCCAGAGGCCCGAGACC7CGG7CCGCGATC7GCCG7TGCTGACGGCCCACGAGGAGCGCACCCAGC7CCACGCG7G 
■ • ■ . ■ . ■ . : . , . . , u 2^010 

CAA7GCCACGGCCGCCCC67A7CCCGACGGCCA7TGCA7GCACCAGC7G7TCGAGCAGCAACTGGAGCGGTCCCCCGAGGCCACCGCGG7 
— < ' ■ ' ' 1 ' ■ ' ' ' ' *" 2^100 

CC7CC7CCAGCAGCAGACG77GACG7A7CGAGAGC7GAACA7ACGCGCCAA7CAGCTCCCCCA7CACC7GCGGAGCCTCCGCC7CCGCCC 
. ■ . ■ . ' ^ ■ ■ ■ « < ■ ». 2&1S0 

AGAAC7CCGCG7GGGC77C7C7CTCGAACGG7CGA7CGAGACGGTCGTGCCGA7CCrCGGCGTCCTCAACGCAGCCGGGG7CTACG7GCC 

. . . 1 . . . — _ , . , . 2£ 2 eo 

GC7CGACCCGACC7ACCCCAGCGAGCGCC7CGGGC7CA7GA7CCAGGACGCGGCGCCCTCCGTGC7GC1CACGCAGACG7CCC7CC7C7C 
. . . 1 . . 1 . 1 . , . .. 2 f370 

pco<7 U1 

GAACC7GCCGCCCCACGGGCA7GCAACGC7GG7ACAGC7CGACGCGC7GCACCAAGCGCTCTCCAGGC7CCCACACCA7ACCCCGCGGAG 
■ ■ • • ■ ' ' ' ' ' «■ 2$3SO 

CGGCGTCACGGCCCAGAACC7CCCA7ACG7CA7G7ACAC7TCCGGC7CGACCCCCCGGCCCAACGGCG7GC7CC7CGAGCACCGCGGCC7 



C7GCAA7C7GCCCACCGTGCAGGCCAAGCTC7A7GCAA7CCCCCC6A6CGACCCGCTCCTCCAGI7CGCGCCGC7C7CC77CGACACA7C | 



2>550 
265MO 

G7K7GCGAGA7CGCGCTCGCC77CC7CtCGGGAGCGACCCTGGTGA7GGGCACGCCCCACGAGCTCCTCCCGGGACCTCCCC7GGTCGA 
. . . . - . 1 . . . ' i 1 i «• 26730 

pco47 HI 

CC7CC7GAAAA AGCACCCG67CACGG CCA7CC TCC7GGCCCC77CCG7GC7CCCAGCCCTGCCAGAACAACAGAGCGCG0CG77CCCCC7 

^coAJ III 

GCGCG7GC7CGCGA7GGCCGGCGAGCCC7GCCCGGCGGAGC7CC7CAAGCGC7GGAAGGCACCCGGACGGCGCC7G77CAAC7CC7A7GC 



2$B20 



2 iSlO 



60 



65 



14 



DE 198 46 493 A 1 

CCCCACCGACACCACCATTTGCCCAACCTCCCCACCGCACCtCTCCCACC^CCGATCCCGCCCATCCC CCCTCCGATTCCCAAT^C^ 

FttU7III ' ' ' ' L 2J700CI 

po47IU p flM| 

AATCTACCTCCTCGACGAACCGCTCCACCC6GT6CCCATCCCCGTGCC6GGCGACATCTTCATCGGCGGCGTCGCCCTCCCCC6GGGATA 

TCACCGGCGGCCCGACCTGACGGCCGAGCGATTCCTACCCGACCCCTTCGGCCAAACCAAAGGGGCGCGCCTCTftTCGSACCGGCGATC C 2 

SGCCCGCTCCCTGCCGGACCCCAACCTCGAGTTTCTCCCTCCAAACCACGAGCAGCTCAACGTCCGCGGTATCCCCATCGASCTGGftGGA 2 

GATCCGCCCGGCGTTCCTGAAGCACCCGGCGGrCGCTCAAGCCGTCCCCCTCGrCCGCGAGGACGCCCCCCCGGACAAGCGCCT CGTCCC 

CTATCTCGTCCGACCCGGA6GAGCGCGCCTCACCCCCGCGGACCTCCCCCAGTCCGTCAGCGACCCATTCCCCGCGACC&T GCTCCCGTC 

GTCCTTCCTGGCGCTCGACCCCCTGCCCCTCACCCCCAACGGCAAGGT GGACCCCCCCGCGCTGCCGGACCCCCACCGCAGCG^ 

■ J ' 1 1 ■ i ■ l 2 

CCACCACCACGTCGCftCCCCGCAACGCCATCC^CAGCAGCTCACACCAATC TGGGCCGACGTACTTCCCCCAAAGCGGSTCGGTCTCCA 
" " 1 ' ' ■ « i 

CGACAATTTCTTCGATCTCGGCGGCCATTCCCTGCTGCTCCTCCCGGTGCATGATCCCCTCGGCCAGC GGTTCCA7CCCCCGCCCTCGAT 
CGTCGACCTCTTCACCTATCCGACCGTGGCGTCGCTCGCCCGGTTCCTTGGCGAACCCCCGAACG6CAAGCAATCCCCCASGG4GGCCCC 
GGCGGACCTCACGGAGCGCGGCCGGCGCCGCCTGGAC6CGCGGGCGCGGCGGC CC AAGGCC ATCCGTGGCCCGACCTGACCCGGGCACCC 



TTCCAAGCCCCCCCGTTCCTCGCACA^ 

CCAASGCCTTCGTGGGCTCTTTCCCCCGCAATCCGGAAGCTGCGCGGCACTTCGTCGCCCCrGCAATGCrcCCATTGTAGAGCTCCTCCG 
CTCCCCGCGGCCTCTrTTCTTGCGGCCCGTCCGCGATTGACCTCACATCCTGATCCCTTCTTGCGTCGTCCAGAUCTCATTCACG-SCCA 



090 
'180 
1210 
7360 

2N50 
75<10 

2 7630 
T720 

2F810 
T900 



279S0 
JOSO 
21170 



GCCCCCCGCtTGACATCTTCCGGCGCCCCCCGATTTCATCGCTCCCGCGCGCCG TGACTCTCACCTGCGAAGGGATTATAMGAAACATA 

1 1 — ■ • — ■ ■ •> . 2&260 

ACATTGGCTCCCTTCTACCCGCCCCCCTCGCGACGCTTCCC TTCGTCCCCCCCTGCAGCCCGAATCACCCTGAGGMCCGCCCTCCGTCA 

J ' ' ' ' ' L 26 



po47 111 

CGTCAGCAGAGAGCCGCGCGGCGCCGAGCCCTGACKCGTCG CCCTCCCGGCGAAGCTCCACGCGGCGCTGGACGGCGCCCCCGCCGCGC 

' ' ' ' ■- » ■ ■ » i — i — 1 ■ > 

AAAAGGCTCCGCCAGCCGCA6CGGCGCTCCAGAGCGGGGACTC TC7CTGGCGGGGCCCCACGGGCGTCTCGCACCTCCTCCCGAGCACGC 

1 1 ' ' — ' — ■ ■-■ — — i - 

pgtll 

CGACGAAGCCTGGAGATCTCTTTCGGATCCCCAGCATCACCAACACCTTCGTCTCTACGC7CATACTC ATGCTCCG6GCACAACGCCGGT 
7G7CCCTCGACCAC6CCCTGTCGAAG7A7CTGAAGGGCA7CCCCGCCCGCGACCAGA7GACCCTCCCCCAGA7CCTCGG7CICACGAGC6 



CGCTC77CGA77ACACGTACAGCCCCGCGC7CCGCCAAA7CATCGAGG7G GA7CCGACCCGCGCCT7CCCCCCGG^GA3:7CA7CGCCC 
— ' ' ' 1 ' — 5 - 1 ' = ■ 2*800 

TC6CCACCCCCGAGGCGCCCTA7TTCGCGCCSCCCGCGGG7nT CCC7ATTCCAACACCAA7TACA7CCTGGCCGC:C7S37CCCCCAGG 

' 1 * " Ul 1 1 1 1 ■ — *"■•< - • ■ — t— • j— ■ ■ > 2*390 

CCG7GTC6CGCGGGAC€C7CCCCGGGC7GC7CCGCAC6C6CA7CCTACA CCCTGTGGGCC7CCCCCACACGTATCTSGACGSCCCCCaCC 

' ' ' 1 ■ ' ' 2*930 

CGCCGG7CCftAGGGC T CA7CCCCG6C7ACGGCCftC7AC6GCGCGGGC77 CC7CGACA7CACCGACCACC7CTCGCCCACCS16GCG7GCC 

1 ' 1 ' 1 . . 1. 2^070 

CCCCCGCCCCCCTGC767CCAACC7CGA7GACC7CAA7CGCTTC7TrOCC C7CC7CA7CAGCCACCAGC7CC7C7C67Cfi;iCCAGC7TC 

' * ' ' ' ' — ' ' ' ' » ■ »• 2$ 160 

AGGACA7CACCACC76GACCCCGACGA7G7CCCCCCACCACCCCGGA7A7 CCCCTCCGCCTCATCCAGCGCCA77CTCCC:iCGGCTCCC 

' ' 1 ■ « - : . 2*250 



i350 

2 mo 

21530 

26620 
2*710 
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DE 198 46 493 Al 

TCAACGCCCACTGCCCAATCATCTCCCCCTTTCA47CGGCCTCCTACGGGGTGCCCCCCCCCCGCGACGCCATCACCCCGCTCATCA4CC 

' ' 1 ' ' — — ' ' ' »■ 29 

^co47 III p»47 Id 

GGACCCACCCCCACGCAGCGCCCCTC6TCGACGAGCTCCCCAAGGTCGTGAAAGAGCGCTGATCGAGGCGGAATCCCAGCGCTTCCGCCC 

' ' — ' * ' ' ' ' 2B 

CrCCTGATGGCCCCCGGCCCTCACAACCCCACCCGCAGCCCCCCCCTCAGCGGCCCTCCCCCCCCCGACGCGGCCACCCCGCCCGGACCG 

' ' ' ' ' ' ' " ~* 1 ' »■ 2) 

ACGAGGA6CCGCGCGACCGCGG6CGCGCTCCCCCCGTCCTCTC6CCGCACCCGCCGCTTGCCG4ACfcCCTAGfiGCGGCAGGCCCiCCCCG 

- ' ' ' ' ' 1 ' 2f) 

ACCCCCGCCACCCCGCCGAGCGCGCTCGCGATCGCCACCTCCC4CGCCTC6GCGCCCGCCGCGCIGCTGTCGTCGTGCCTCCCGAAG4CC j 
" ' *~ ' ' ' u ' ' ' 2 

tGCACCGCGCCCCTCAGGATCGCGCCGCCGCCCAGGGTCGTGAGGACGAGCCCCGAGATCACCAtCACCGGGCTGTTCC4CTCCCTC6TC 

' ' 1 1 1 ' 1 1 2 

CCCTCCTCGAAGTCCCGGAACGCCCCCCTCGCCGCCGCCAGCTCCACCTCCATCCGGCGCTGCTCCGCGCGCCCCTCCrCCCCCGACCCG 

■ " ' ' 1 ' 1 ' 2 

ATCTCGTGGACGCCGCGGGCCTGGCCCTCCAGCGCCGCCiTGCGCGCCTCGTGCGCGCCGGCGCTCTCCTCCCACCTCCCCCCTCGCGGG 

— 1 ' ' ' ' ■ 1 ' ' ' ' 2 

ftCCCCCGCCACCCCCGCCGCGACAGAGCCCGCCGACGCCGCGGTCGAGGCGGGCGCCCCCCGCGGCTCCGCGGCCACCGAACGCGCCCCC 

' ' ' *- 1 ' 1 — ~» ■ ' >— * 3 

GCC6CGGGACGCGCGGGCGGCTCCGCGGCCACCCAAGGCGCC6CCCCCCCCCAAGGC6CGGGCGACTCCCCGGCCACG6AAGGCGCGGCC 
' ' ^ ' - ' 1 ' ' ' fc ' 1 ' L 3 

GCCGCGGGAGGCGCGSGCGGCTCtCCTGCAACCG4G4GCGCGGGCGCCCCCGCACCCAGGCCCACCCCCCACCCCACGACACCACGGCGC 

— ' 1 1 ' 1 ' ' * ' ' ' ' >- 3 

GCCGCAACCGCCCGCGGGCGCGCGAACCCGAGCTGGACCTGCTCCAT6CGC6CAGCGTCGCCCCTCCACAGGGCCGGGTCAACCCCCCCC 
1 ■ ' L ' 1 ' 1 ' ' 1 ' ' L 3 

AGTCCGAGACCACGAGACCTCCCCGCCGCAGGAAACACCCGCGCCGGCGGCCCCCCCGGCGGCTCGCCGCTCACCCCTCGCGCGGCCGGC 
■ ' -> ■ — ■ : . , '3 

CGCCCCGCCCCCTCCCCTCCCCGGCCCCCCCCGCGTCCGCGCCCACGCGGAGCAGCTCCTCCAACTGCCGCTCCACCCGGCCC4CGTCGA 


310 

130 
520 
610 
7C0 
>790 

mo 

>970 
)060 
3150 
)240 
5330 

mo 

>5t0 
)600 
«90 
)780 
>870 
)9S0 
050 

tqo 

230 
320 


1 — ' ' ' ' ' 1 «— — ' ' ' 3 

TGCCGTCCATGAACGACGTCAACGCCAAGIACGCCACCAGCGTCTGCCACCCCCCCACCCAGCCCGGGACGTACCCC6GCCGCTCCAGCA 


' J ' -J ' • ■ 1 ■ — ' ' » ■ «- 3 

CCCCGGCGGCGCGCAGCTCCGCCAGCACCGCGATGTCGTCGACCCCGATCCGGCCGCACACCtGCAGCTCCACCTCGTCGCCCAGCCCGC 


■ ' - • ■ ' ' < ' ■ 1 ' 3 

CGCGAAGGACCCCGGCCAGGAAGCCGTAGACCrCGACCACCCCGGCCAGGrAGCAGGCGTCCTTGGTGftACCGCGCGCCGCCCTCGACGA 


' ' - 1 ' 1 ' J ■ 3 

GCCCGCCGCGCCACACGCGCTGCGCCTCGAAGTACGCGTCGCGGCGCTCGGCGCCGCGCTCGCGCAGGTGCCGGTACAGGTC6AGGAAGC 


■ ' 1 ' ' ' 1 ' 1 ' 1 ' 3 

- TCGCGCCCTCCTCGGCCAT0TCCACGAGCCGCACCCCCTCGGCGAGCCGGGTGAGGCGGCCGATGGAGAGCGAGCG6CTGTAGAGCTCCC 


* ' 1 1 ' ' 1 ' : ■ «- 3 

CGAAGATGCCCAGCCCCTCCrCCGTCCGCGTGGTCCCCGGGCCGCCCGACCCCACCAACGCGCACCGCCCCTCCGCCGCGCCGTTCrCCC 


- ' ' ' ' ' ' ' ' » ' ' L 3 

CGGTGAGCGC6TGCGTCTCGACCTCGTGGTGCCACAGCCCCTCCGCCTCCCAC6CCGCGftACCTCGCClCCGCCCGGATCCGCACCCGGC 


' 1 ' 1 1 1 ' ' ' — « = ' 3 

TCATGCCGGCGACCACCTTGCCCGTGACGCCCGGGTCGACGGTGATCTCGA6GTCGAGCCGCGCCGCCCGGCCGGCC6CGCGCCCGGC6A 


■ ' ' ' ' ' 1 ' * ' ' ' 3 

GCATCTCCCGGAGCGCCCCGCCCrCGAGCCGCTCCTCCTCCGCATCCCTGGCCTCGTCCCACCCGTGGACGCCCAGGCGCTCGGTGAGGT 


— ' ' ' ' ■ ' ' 1 ' 1 3 

GCTCCCCGAGGTCGATCTTCCTGAGCGACCCCCCGAAGAACCGCGACCCCGCeCCGCCGTACACCTCCTGCGACCGCGCCCACaACCCGC 


' ' ' 1 ' ' ' ' 1 ' ■ » L 3 

GGGTCCCCGCGGCCTCCACCAGCTCCGCGGCCTGCAlCTCCGCGCCCftCGTTGTCCCGCAGCCACCCGACCGCCCGCGCCTCCCCGTCGl 


Joto 
|soo 

1 


* ' ' ' 1 ' • • 1 ' 1 «- » 1 3 

TGGCCCCCACGAGCTCGCCCAGCTCGGCGACGCCCCCCGCGAGGCCGTCCCCATCGACCCGGTACTCCACCTCGGGGAGGCGGTCCTCCC 


1 ' 1 r- ' ' 1 ■ ■ ■ ' i ■ ■> : 

Eco47 III 

r 

CGGCGCCCAACAAGCGCTCCTCCACCTCGCCCCGCCAGGtGATGTCCTCCACCAGCTTGAGGGCCTTGCCCTCCGCCAGGCGGCCCCCCA 


J590 

\ 680 
\ 770 
5 860 


CCCGATCCAGCT6CTCCACCACCGCGCGGTCCATCCTCATCG4GCCCACCATCCCCGAAACCGCCACACCCCGGAACCGlCATTCCCrCC 


ACGAGGCACCCAlTGCCATGTTCCGTCGCrTTTTCCAGCGCCGTCGTCGCGCTCCCCTGCGGGCTCCGGCCATCCACCGCGGTTCCATGC 
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DE 198 46 493 A 1 

ACCCACQGTCTTCCCCCCCTCGCTCGAC4CCCrcCTrTCCCCCACACCCCAC£C4CCAATGCTCCCCCCCC4CCCCCCTTC*CCCTCCAC 
' ' 1 1, 1 ' ' 1 ' L 3)950 

CCGCCGCACAGCCGATGATACCGTCCGGCCeATGTCCCACACTGTAGCTCAACTCGA4CAACACCGCCCGGCGCTCACC65&CACTGCTA 
' ' »- — ■ 1 1 ' ' 1 ' 3 >0H0 

CCCCATGCTGGGTTCCCTCCTCCACCCCC&CGACCCCGT CCACOAGACQATCCTGCGCGCCTGGCQQACCCTCGATAAGTTCGACGGGCG 

' 1 1 » ■ ' ■ « ^ 3 j l30 

CTCGTCGCTGCGCACC1GGCTGTACCGCATCGCGACGAACCTCTGCATCGACCTGCGCGCCGACCGCGCGC6CCGGGCGCCCCCCATCG4 
■ « ' ■— i ■ 1 ■ . 32220 

GGAAGGCCCGGTCGGCACGGTGGACGACGCGCTCGAGACCCGCCCGCGCACCCACTGGCTGGAGCCCCTCCCCCAtCCCCACCCCCTCCC 
' -' ' 1 ' ' ' ■ ' ' ■ — 3^310 

CCCCCACATCGACCCCCCCGAGCGGCCGATCCTCCGCCAGAGCATCC6CCTCCCGTTCGTCGCGGCGCTCCACCACCT6CCGCCGAAGCA 
' ' ' ' ■ ■ ■ ■ i 1 ' 1 ' ■ «> 3*400 

GCGCGCCCCGCrGCTGCTCACCCAGCTCCTCGGCTGGTCCCCCCCGGACCTCGCCGACACCCTCAACACCTCGGrCGCCCCCATCAACAG 
■ ' ' 1 ' ■ — — ■ ■ »• 3 !190 

tGCGCTCCACCCCGCGCGGGCGACCCICGCGAGCCGCGATCTCCGCGACGCGCCCCCCTCCCTCCCGGAGCCGCAGTCCCCGCTCCTCGA 

■ ' ' ' ^ — • ■ ■ ■ 1 1 . 1 . l 3 > 59 o 

CCGCTACGTCAACGCCTTCCAGCGGTACCACGTCGACGCGCTCACGGCGCTGCTGCACCACGACCCGACCCTGTCGATGCCGCCCTTCAC 

' — ' ' ' ■ ■ 1 _. U L 3 b 670 

CCTCTGGCTCCCCGCCCACGAGTCCATCCCCCCCTGGCtCGTGGGCCCCCCACCCGGCTGCCGCCGGTCGCCGCTCATCCCGACGGCCCC 
« ■ ' ' ' « 1 — * . 1 , 1 . l 3^ 760 

GAGCGGCTCCCCCGCGTTCGCCCACTATCGCCCGGCGCCCCACGGCCGCCACCGCCCCTCCCCGCTCATCGTCCTCGiCCTCCCGCGGGA 
' ■ ' ' ' ■ 1 «- ' ' ' ' 1 *" 3fcSS0 



CCGCATCGTCAGCATGACGTCCT TCCTCGACACCCAGACGCTCTTCCCGCG6TTCCGCCTCCCCCTCGATCTACCGGCGTAGCCCCCCCC 
CCCCrGCCrCCCTCCCCGCGGGTGCCCrcCCTGCCTAGCCGCGGGCCCCCGGCCTGGCCACGGCCCCCCCCCCTCGCCACGGGCGCCCGG 



32940 
3h030 

CCACCGACGGGCCGACCATTTTTTTCTGAGCGACCGATGAGTCCTGACGCGGCCGGGGGTCTACGCCGCTGAATCCAACACGGAGDCACC " 
' ■ ' ' ' ' ' • ** « ' *■ 33120 

CATGACCGTGACCATCGCCAGCATCCATCATCGTGACCAGCACCTCATGACCGGCCCCCACCCCAAGGCGCCGGCCCCCCCCGCCCCGCC 
1 ■ ' 1 1 — ' 1 332)0 

CGACCCGGCGCCGTCCAGCCGAGCCGTGTGGCCGGGCCGCGTCCTGACCGGGCTGGCCACGCTGITCCTGACGTTCGACGCCGCCCTCAA 
' — ' ' " ' 1 ' ' ' ' : ■■ 33300 

GG7GCTCAAGCTGTTCCCCGCGGAG6CGTC6ACCCCCGAGCTCGGGTTCCCCGCGCACCTCGTCCCCACCCTCGGCTACCTCCAGATCGC 
■ ^ ■ ■ ■ « ■ • • ■ 1 1- 1 3^390 

ITGCCTCGTGGCCTACCTCATCCCGCGCACCGCCCTGCTCGGCGCGATCCTCTGGACCGGCTACCTGGGCGGCCCCATCCCGATCCACGT 
' ' ' ' ' 1 ' ' « ' ' »■ 3$4BO 

GCGGG7CGAGAACCCGCTCTTCAGCCACACGCTCTrCCCCATCTACGTCGCCGCGTICCTCTGGCCCGCGCTCT6G:TGCGCGACCGCCC 
■ • ' • — ■ — * . . . . u 3^570 

CGTCCGCGCGCTGACCCCGAGCCCGTCGTCGCACGGCCGATGAGCTTCACCTTTCACGAGAGTCCATCACCGTAAAAGGAGAAGCCACCC 
- »- • 1 ■ . 1 — . ^- . . . ^ 3J66O 

ATGACCACAAAGAACCCCCGCAAGCTCTTCGTCAACCTGTCCGTCCGCGACCTGAACCCATCGATGGAGTTCTTCACCAiGCTCGGGTTC 
' « ' 1 — — ' ' « ' 1 — ■ ' « ■ 3)750 

CAGTlCAACCCGCAGTrCACGGACGAGAftGGCCGCCTGCATCGTCGTCAGCGAGGACGCCTATGTCATGCTCCTCGTCCtCTCGlTCTTC 
• — » ■ ■ ■ • ■ — — , 1 , ^ 3 * 8 qo 

AACACGTTCATGAACAAGGAGATCTGCACCACCACCACGCACACCCAACGGCTCTTCGCGCTCTCCTGCAGCAGCCGSCCCGACCTCCAC 



^amH I 

GACATGGTGAACAAGGCGGTCGCGGCCGCCGGGTCGCACGCCATGCATCCGCACGATCACCCCTTCATGTACGGCTCSiCCTTCTACCAC 

■ • ■ 1 - ■•■ - • - - * i - ■ , - » - 

CTGGATGGCCACCACTGGGAGGTCATCrCCATGGATCCCAACCCCArCCAGCCGTAGCCGACGGGGCTGGGCGCCCCCCCTCCAAGAGCC , 
— 1 — ' ' — ' ' ' ■ ■> 3- 

CCCCTGAGGCGGCGACGCGGGAGGATCACCGTCT7CGTAGCCCACACCGATGCAGTATCCGTCCCGC7TCGTATCGAAGCACGGCICTTA 
* - . « . . ■ ■ , e . , , , , l 3 : 



3$930 



3 020 



no 

200 



CGCCCCCGTCAGAGCCCCTCGCAGGTGATCCCCACCCGCAGCAGCCACACGCCCACGAGCGTGGCTCCCATCGiGilGAGCCGAGTCTCG 
. . 1 . ■ 1 . « . 1 . 1 _^ l 3^290 

CCCATGGTCTCGGGGTCATCAATGGATGAGTAGGGCACTCCCTCCTTCQTCACGTCCTCCTCCACGGCCACGCCGAMCCCACCICGAAG 
. 1 • ■ . — • ■ ■ . ' »■ 34360 
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DE 198 46 493 A 1 



3« 'A70 



5S0 



TGCACCGCCCCTCGA CCGAADATCCAGCTCCCCCCCCC6CGAGCCCCCACGftAAAGCCTCTC6CC6TCC&CCCCACCCCCCTCGTCCCAG 
CCCfiGC0ATCCCACCCCGGTCT A6CTGTGTTTCCCCAACCAACCCCCGACCCAGAGTCCftAGTCCGACC6GCGCTCGCCACCCCACGCCC 
CCTGTC GCCCCGACGCCGCCCAAGCTCTCCCCG^ACGCTTATCCCCTGTCTCGATCAAGCCACCCACCTCCATGACGCTGATGCGGTAC \^ 

CTGAGCGCGAGATTGACCTCCACCCCAGCGCTCTCCCACCCCCAGTAGAGGCCGGCCCCCACCTCCACCCTGAAfcTCCATGCTCGGCCCC 



co47IH . £aij*HI 

7qo 



GATCCCCGC CCAGGAGCGACGCCAGGGCCGCTCCCCTCCTGCGCGCGGGCCGTCCCCACCCAAAGAAAGAGGGCTGTCGCCAACAATCCA ^ 

AGCC AGATCGATCGAA6TGACCCCATSTCGGSCCCrGGAGCATCCCC7CTACCAGGTGCGrCCTATTCATCCCCCGCGCCGCCGGGCGCC ^ 

GCCCCCCTCCCC TGTCCGACCCCACATCACGAATCCGCCATCCCTCCCCTCGCCCGCCCGCCGCTCTCCTTCCCCTCCGGGCGTGCGCCG * ^ 

CCGCTCGTCTCCCCCATGGCAACCTTGTCGCGGTGTCGCTCGAACAGC ACACAGAGTATCGCGTCCGCAACAACCCCCCCACCCCGCGAG 

, ju— * ■ ■ ■ ■ ■ ' - ' 0 

ACGCTCGTG GGGCCCCCTGCCTCCCCACTTCATCATAACGCCATCAGGACCACTCCACATTTCATTTCT TCACCTCCACTGCCTGAGCCC 

~" p<*7M 
CACGCTCCTCCTCATCGGCC GGTTCCTCTG6C6QTTGCTCTGGCGGCGTTTCT6ACCCCCGGA4CTAACCC7TCCAGCGCTCCCCCTTGC ^ 
TCTCCCGTTCCTTCAGCTCCTCCACCACCTCGTCCAGGCGCTCCTACCTCCCTTCCCAGAAGCCGCGGrACTTCTCCAGCCAGCCGCTGS ^ 
tCTCCTCGAGCGGCTTGCCCTCCATCCGACAAGGCCTCCCCTGCCCGTCGCGGCCGCCCGACATCAGGCCCGCTCGCTCC^ 
GGT CCTTGGAGATC6CGGGCTGCCTCATC6CGAACGGCTTCCCCAGCTCGGTCACCGACGCCTCCCCGGACGCGAGGCGCGCGA6GATCG 1^ 
CTCGCCCTGTCGGATCGGC GACCCCAGCGAACGTTGCGTCCAGCCCCTCGGACGGGGTCATTCCATA&CTCCTTGGTfeUAAAACCAGTT ^ 

,730 



830 
920 



100 
190 



I2&0 



AGTTATACAACCT GGGGCCCGGGCGCTCAACCCTCCAGGC6ATG6CGCTTCCGCCCGGG6GCTCCGCTCGCCCCACCCCC6CCGC6CGGC 
7ACCTGCGC6GCGCGGTCAGCACGTCCTGCAGCGTCCCGCCGACCACGGGCTTCCTCACGTCCAGGTCGAACCCGCCCCCCCTCCACC7C ^ 

fco47 III 
I 

CCCTGATCGTCCGCCCCGCCGTAGCCCGAGAGCGCCACCAGGTAGAGCGCT.TCGCCGCCGG GCGC6GCCCCCCCCCCCCCCCCGACCTCA 

- ■ t i ■ . — 1 — — 1 ' 1 ' 

pind 111 

tAACCCTCGATCCCGGQCAAGCCGATGTCCACGAAGOCCACCTCGGGGCGCAGCTCCAGAtCCTTCTTCACGCCCKCAGCCCGTCCACC ^ 
CCCACCGUACCTCCTCCCCCAGCGCCTCGATCTACCCCCGCATCACCCGGCCCACCTCCTCCGCGTCCKCACGACGAGCACCCCGCCC ^ ^ 

CCCKACCCGCCCCCTCCCGCCCCK^^ 3 , 180 

GGGGCCCGCCCGGCGCTCGGGGCACGCTGCGGCGCCGCCCCGGGCCCGACCGGCAGGCGCACGGTGAACTCCCTGCCCTGGCCCGGCCCG ^ ^ 

CCCC tCGCCGCCGCCACGCTGCCGCCGTGCACTTCCAGGAGCCGCCGCACCAGCCTCAGCCCGAGCCCCAGCCCGCCCGTGCTCCGGTCC q 

ATGGlCTGQTCCACCTGCGTGAACAGATCGA 'CACCTTCTCGAGCATCGCCGCCCGGATGCCGCGGCCCGTGTCG CG-^CCCGCAGC^CG ^ ^ 

CCCTCGGGCGCGCCGACCCCCGCCTCGCGCGTGACCCCCACCGAGAtCGAGCCCCCCCCCCCSCTCTACTTC GCCCCGTtGGTCAGGAGG ^ 

7TCGTCACCACCTGCTCCAGCCGCGTCGCGTCGGCCCCCATGCCGAAGTCCCCGGGCCCCACCCACAGCCACACSTCU GGC6CCGGGCC ^ ^ 

T CGACGGCCGGCCTCACCGCGGCGGCGGCGCTCrGCACCACCGCCGCGAGATCGACGTCCTCCAGCCCCACC TCCACCGTGCCCCGCGtG ^ ^ 

ATCCCCGACACGTCCAGCAGATCCTCGACCAGCCGCACGAGGTCGCCCATCTGCCGCCGCGCGATCTCCCCGTAGCGC GCCGACGCGGGC ^ ^ 
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CCCTCCCCCTCCGCCTCOTCC^CAGCCTCiCCCUACCCTGUCGAGGCCATCGGGTTCCCCtCCTCCTCCCCC^CMCCCQAGGAA^ I 
TCGTCCTTGCGCTCATCCCCCAGCTTCAGCGCCTCGACGAGCGCCTCCACCCCCCKCCCGCGC6CACCTCGTCGSTCACGTCCA1CCCC 1 
AACACGAAGACGCCCTCGACCGCCCCGTCGCGATCGCGCATCGGCTGGTACACGAAGTTGAACftACACCTCCTCCG TCGTGCCGTCCCCC 
CGGCGATCQAGCCCCACCGCGA6CTCCTTQCCGACGATGGGCTCGCCGGTGC6GACCACCGC6TC6AGGAGCTCCC^GATCCCCTG1CCC 
TCG ACCTCCCGGAGGGCGGCCCCGATCGCCTCCCCCACCAGCGATCGACCGCCGACCAGCCCCTGCTACACCCCCTTCACCtCCTCGAtG ^ ^ 
ACCrCCTCCGGCCCGCGGAGGATCCCGATGCCCCCCCCCGCCTGCATGAAGAGGTCGTTCftGGTKTCCCGCTGCCCCtCGCCCTCCCCC 
CGCCGGC6CGCGAGCTCGACCTGGATGCSGACCCGCGCGAGGAGCTCCTTCCCGGAGAACCGCTTC ACGAGGAAGTCGTCGGCGCCGCCC 
TCGAGGCTCTCGACGCGCCCCTCCTCGCCCGCGCOCGCGGAGAGCATCACCACGGCGACGCCGCGGGTGCGATCGTCGCCGCGCtGCGCC y 



CTGAGCAGCCCGAAGCCGTCGACCCCCGGCATCA 



TCACCTC6GTGAGCACCAQATCCGGCGCCTGCCCCCCCCCCCCCTCCAG6GCGGCC 



CGACCGTCCGCCACGGCCTCCACCGTCCACCCCTCCCCCACGA 



CCAGCC6CAGCGCGTACTC6CGCATGTCCCCCTTCTCCTCCCCCACG 



AGCACGCGCCCCCGCAGCCTCCCCGCCGGCCCCTCGCCCGCCGCCCGGGACCCCCGCCCCTGC TCGCCGCGGAGCCACTCCGCGGCCTCC g 
TCGAGGAAGGGCGCCCCGTCCCGCCCCCCCGCCGCCCCCGCCCaCCCCGGCGCGAC 



530 
'620 
710 
800 



I 
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SEQUENCE LISTING 
<110> Gaaellachaft fur Biotechnologioche Forschung GiribH 

5 <120> DNA-Sequenzen fur die enzymatische Synthase von- 
Polyketid- oder Heteropolyketidverbixidungen 

io <130> DNA-Seq zur enzym Syn von Polyketid . 

<140> DE 198 46 493.2 
<141> 1998-10-09 

15 

<160> 1 

<170> Patentln Ver. 2,1 

20 

<210> 1 
<211> 37856 
<212> DNA 

25 

<213> Sorangium cellulosum 



<400> 1 

30 ggatcgcggc gccctcgcgc 
acttgccgag gccaggcgcg 
aatggcgcca ctcggtcgcg 
gcttgccgag gagccgfcggg 

35 ctccgggccc ctgtaccgtc 
gccggatctc cggcggcgac 
ccagctcgcc gaccggcagc 
gcacgcctcc gagcgccgcc 

40 

ccgtgggcga ctcggcgccg 
ggcgcccgcc gtggcgcgcc 
cctccgagag cgtggcgccg 

45 ccttgcgctc ggccgtcgtg 
ccccgatcga gagcccctcg 
cgcgcggccg ctctcccgcg 
ccgggatace gtcgcggagc 

50 ggagcgcgag cgcgctgttg 
cgcacccgag cgcgaacacg 
cgggcgctat gtacccgggc 
gccggaggtg gcgcgcgatg 
cgagcatcag gttgctcggc 
cgagcgtcgt ggccacgcgc 
cggcgagccg ctcctccagg 
ctgcgccggt caccccgtgc 
gcgcctccgc ctcccgcgcg 
tgagcgcgac cgcctgcccg 
cggagacggc gagccgctcg 

65 



tgctcctcga gcgtgcggag 
cccaccacca ccaccgcgtt 
agctgcgaga gctcgcgctc 
acggcatccg gctcctcctt 
tcgaagcggc tcgcgagcag 
aggccatctc gcccggcgat 
ctcgcctcga cctcggccag 
cgcagcgcga gggcgcagtg 
gacagcgcga cgagccacca 
gcgatgtecc gcagcgcctc 
gcctcggcgc cgccgtcttc 
atcgcctcgc ccggcgcggc 
ccggccacgg cggcgagctc 
ttcttcgcca gcatccgcgc 
tccccgagcc gcggcggctc 
ccgaggaacg gcgggcgccc 
tcggcccggg cgtcgaccgg 
gtgccgagca cggccccggg 
ccgaagtcga gcagcgtgac 
ttgaggtcgc ggtgaacgac 
gcggccagcg ccacgctctc 
gtcacgccgt cgagccactc 
gccacgtact gcaccacgco 
aaccggcgca ggtcgttggc 
gacacccggt cgcgcgcccg 
atctcgaaac gatcctcgat 



gaactcccac 


gccaggcgcg 


60 


cgcggagggc 


tcgtcgacgc 


12 0 


ccgccccacg 


cagggcgteg 


180 


cgggccgcga 


agccagcacc 


240 


gctggccgfcc 


gcgtcgtcga 


300 


gagctgcgcg 


acccgatcga 


360 


ccctgtcgcg 


acggacacgg 


420 


ggccgcccgt 


gtggcgagat 


480 


gcgcgcttgc 


agccgatcga 


540 


ggeccgcgcg 


gcgccgtcgt 


600 


ggccaggatg 


acgcacatca 


660 


cggcgccgcg 


accgcgctcg 


720 


egccgcggcg 


gcggcgccgt 


780 


caccaggcgc 


tcgagcggct 


840 


ttccaggacg 


acccgcatca 


900 


cgcgaggcac 


tggaacagca 


960 


cgcgtcgccg 


cgcacctgct 


1020 


cgacgtgagg 


gtcggcgcga 


1080 


gcgctcgacc 


gcgccgccca 


1140 


gccgagccag 


tggatcgcgc 


1200 


ggccagcgtg 


agcggcgccc 


1260 


catggccagg 


taoggccgcc 


1320 


gggcagccgg 


agcgtcacga 


1380 


gctcgcgccc 


tgcaagacct 


1440 


gtacacgtco 


cccatcccgc 


1500 


cacatccgct 


gcgcgcatgg 


1560 
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15 



20 



cggtgccaat gtactccgcg cgagcctcgg gcccccgcgc gtaagtgcgg ccctgcgccc 1620 
ggttgaacgc cagcccgagc gtgaccgcct cgcgctcggg atecacggcc gccggatcgg 1680 
tccacgcctc gacgagcgcc tgcgttgaac aacccgccac cgggcgcacg cagccggcat 1740 
cgccgcgctg gccacccggc gctgccgccc ttaggctcac ctccgcgatg ccccgctggt 1800 
tcaacacggc aggtccctgc aacccggccg atcactacat gctcccggcc gaggagcgct 1860 
tgcccgcagt gcgcgatctg gtcgatcgca aggcctactt cgtcctgcac gccccgcggc 1920 
agatcggcaa gacgacctcg ctgcgcacgc tcgcccagga tctcacggcc gaagggcgct 1980 l0 
acgtggccgt cctcgtctcg gcggaggtcg gcgccccctt ctctgacgat cccggcgcgg 2040 
ccgagctcgc gatgctcgca gaatggcgcg gcaccgccgg cgcgcagctc cccgccgatc 2100 
tgcggccgcc accgttcccc gatgcgcccg ccggtcagcg catcggggcc gccctgcgcg 2160 
cctgggctca ggccgcgccg cgcccgctcg tcgtcttcct cgacgaggcc gacgccctgc 2220 
gcgacgcgac gctcgtctcc ctattgcgcc agatccgcag cggctatccc gaccgcccgc 2280 
gtgacttccc gcacgcgctc gccctcgtcg gcctgcgcga cgtgcgcgac tacaaggtcg 2340 
cgtcggtcga cagcggcagg ctcgggacgt cgagcccctt caacatcaag gtcgagtcgc 2400 
tcacgctgcg caacttcacc cgcgacgagg tcgcaacact ctacgctcag cacacggccg 24 60 
agaccggtca ggtcttccgg ccggacgccg tggaccgcgc cttcgagcte acccagggcc 2520 
agccgtggct cgccaacgcg ctcgcccgcc agctegtcga ggtcetcgtc aaggaccgcg 2580 
cgcaacccat caegtctgcg aacgtcgatc gcgccaagga aatcctcatc gagcggcagg 2640 25 
acacacacct cgacagcctg gtggatcggc tgcgegagcc gcgcatccgc gcggtgatcg 2700 
agccgatgct cgccggcacc gcgttgccga gcgtgccccc cgacgacctt cgtttcgcga 2760 
tcgacctcgg cctcgtgcgc atgaccgcgg agggcggcct cgacgtcgcc aaccccatct 2820 
accgcgagat catcgtccgc gagctcgcgt tcccgatccg cgcctcactc ccccagatca 2880 
aggccacgtg gctcacgcag gacggccgcc tcgacgcgga ccgcctgctc gacgccttcc 2940 
tctccttctg gcgccagcac ggcgagccgc tcctcggcgc cgcgccctac catgagatcg 3000 
ccccgcacct cgtggtgatg gccttcctcc accgcgtggt gaacggcggt ggcaccgtcg 3060 
agcgcgagta cgccatcggc cggggcagga tggatctctg cgttcgttac gcgggcgaga 312 0 
cgctcgcgat cgagctcaag gtctggcgag acggccgccc cgatcccgtc gccgaggggc 3180 
tcgcccagct cgacgagtac ctggccggcc tgggcctcga tcgcggatgg ctcatcctct 3240 
tcgaccagcg ctccggacag ccccccatcg ccgagcgcac gcgccgcgag cgcgcgctct 3300 
cccccgccgg ccgcgaggtc gccgtcattc gcgcctgagg gagctcgccg cgcggcgagc 3360 
gccctccacg agggccgggc cacctcggac agcgtctcta ctcctccgag gccgccgcgc 3 420 
cccccgcccc ggccgccgcc gccgccgccg gctccagctc gcagcgcacc accaggacct 3480 
cgccatccgc gagctccggc cgctccacga gcgcgtgcgc gcccgcgcgc accgccgtga 3540 45 
gcacgtctcc cagcgccggc ttcagcegcg ccagcgtcgc ggcgttcgcc ccgagcgcga 3 600 
ggtcggtcac gacgcgcccc acgctcgcgc cgagctcgct cttgcgcttg ttgaccgccg 3660 
ccatcgccgc cgccgccaga tccaggagec ccggatccga aggcgccgcg accgccgcga 3720 
aatccgccgc tgaaggccac ttcgeccggt ggatcgaggt atcgcccgtc tcctccgcgt 3780 
acacccagcg ccagaccteg tcggtgatgt acggcaggac cggcgcgaac agccgcagca 3 840 
gcaccgacag cccgagccgc agcgccgcca ccgccgagcc gcgcgccgcc tccccggcgc 3900 
cgccctcgcc gcgcgcccgc gccttcgcga gcbccaggta ggcgtcggtg aaccagcgcc 3960 
agaagaaatc ctcggtccgc tcgagcgccg ccgcgaactc gtgctcgtcg aacgagcgcg 4020 
tcgcgtcgtc caccacggcc gacagcttgt gcaagagcgc ccggtcgagc tcctcggaga 4080 
tcgggtggac ctccgccgac tggctgagca cgtacttgct cgcgttccag atcttcgtga 4140 
cgagccgctt gccgatcttc agcaccttct cgtcgaacgc cgtgtccgtg ccgagccgcg 42 00 60 
cgctcgccga ccagtagcgg accgcgtccg aagaatacgt gtcgagcagg tgcatcggcg 4260 
tgacgacgtt gcccttgctc ttcgacatct tcttgcgatc cggatcgagg atccacccgg 4320 
agatcgcgac gtggtgccac gggaccgacg actcgtgcag catcgccttc gcgatcgtgt 4380 
agaacgccca cgtcctgatg atgtcgtggg. cctgcggccg cagatcggcc gggaagagcc 4440 



30 



35 



40 



50 



55 



65 
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gcgcgtggcg 


cgccggatcg 


tccccccagt 




tgaaccacgt 


gtcgaagacg 


teggactegg 


5 


acgcctcgta 


cccgggcggc 


acgtcgaccg 




cgagcagcgg 


ccggctgtga 


tccgggttgc 




actgcacgcc 


gaaataccgc 


tggcggctoa 




agttgcggta 


ccggaggcgc 


atgaaatccg 


in 


ggagctcggc 


cttcttgtcg 


gcgagccgga 

^» w 9 9 9 




gcggctggtc 


gccccgctcg 


tagaacttca 




gcagcgccgg 


cccccggccg 


ggcgccgccg 

aa 9 23 53 




ccgccgcgcg 


cgcctgctte 


acccccctgc 


15 


cggccgggtc 


gcggctctee 


cacgcgccct 




tcttgccgag 


catctgccgg 


agegggaqct 

23 23 27 27 23 




cgtcgccgaa 


ggtacagacc 


ateaggatge 


20 


tcgggaagat 


cggcaccggc 


gcgcggaaaa 

23 w 23 w aa 23 


gctgataccg 


cgggtcc tec 


Cf Oct fc decree cr 

2327 23 '•S^yv^y 




ggcgcgtcgt 


ggcgatgacg 

a a a a a 


agctcctcgg 




ggaacqcacc 


coat tocooo 
v y uu *"a , -a a a 


ccfateeteoa 

w y ^ w w w ^«wy cl 


25 


cgacgtccca 


catcgtcggc 


(jcyaayaCCy 




caaacqacaa 


ctocaccate 






agtcgaccga 




**99 c 9y sago 




tgaccttgtg 


ccacraoctccr 




30 


tdatccffcetc 




ugeggcaagg 




c oot cr c crcr n c 


y *»yyw«»y y 


^ 4- n ^ a *+r**+ 

btCkycaCyC 




agcccatcgg 


ataaaaaata 


t tea acre cere 

w s»y u y *"*y ^ 


35 


tgtgcgtgta 


cctoaaaaco 


fcooeeoafecf fc 
**yy *»»-y «• w y *<• 


tgtcgacgac 


gaaggtctcc 


tegcoooooc 




cctcccacag 


gtcqcrccaoa 

23 -3 23 " y 23 


ccrcacrctcacT 




tcgcgggatc 


qa tggaocoo 


aaegtcttet 


40 


ccccgcagga 


accgcccgcg 


qqaccqacat 




cgcgccgcgc 


ccgcgcggcg 

•f 9 9 9 9 


gcgatccgcg 

25 23 23 23 




ggctccgccg 


gcgcgcgcgc 


gccgtccgtg 

27 2J ■*^"~"27 27 




gtggaggacg 


ccqqcqqcqc 


coccacooaa 

«-y^*<y^yy«y 


45 


cgaggccggg 


ggefceagteg 

a a 53 w 23 


taocqctcaa 




cgccgcgggc 


gagctcgegg 

2? a w " 23 " 27 9 


acqaacaaaa 




gcggcgccgg 


atctccgctc 


ttctccgcga 


50 


gcacgtagcc 


gcggcggccg 

^ 9 9 9 


gcccacgacg 


ggatccggtc 


ggatccgcgc 


gcgagcgcct 

a^a ~a 23 




cgaagcgcgc 


gecgaacagg 


atccacaggt 




cgcgcagcat 


gctccggagc 


ggcgtgatgc 




cggaatcccc 


gggatcgegg 


gtgaagagee 




cgggctcgag 


ccggtgcagg 


tgctccgagc 




gatcgaagcg 


gggcgagccg 

^99 9 9^^"^27 


tcggcrcocoo 

232323^23 2327 




cgcccgggag 


egggaggacg 


aggttgaccc 


60 


cgtcggcgcg 


ctcgaacgag 


agctcgcgca 




ggcgggcttc 


gaacggttcg 


gcgtggatca 




ggccgcgcgg 


gtggcgaggt 


cttaccgcag 


65 


gggaagggcg 


ccgccggagg 


gcgcgcaatc 


cgccggagcg 


cgcggccggg 


ccgccggccc 



gagagctgat 


ctgcggcgtg 


aocoaac teg 

a ^y a y 


4500 


eggtgaagee 


geegggctog 

y a 23 a ^ a 23 


tcccgc tgcg 


4560 


tegggtcgae 

27 27 27 '■"JJ 


caggaocatc 
^ y y y **y 


tt a t 9 l "a tc a 


4620 


cctcggcgtc 


oaocooatac 

y«»y vyy«**.«v. 


^.ayav.wyyya 


4680 


tgcaccagtc 


accctnrrano 

u \_ w wyy cl 23 


ggg teg g tec 


4*74(1 


ggtgccactt 


gate t tot co 

a w ^ y *»wy 


v,v.y tot wwya 


4800 


cgaaccactg 


ccqcotocrcTc 
^ — ^3 23 yyy 


y »«* t, Lcga 


4860 


ccocococtc 


y <* n-yyt-wUG 


ggctcgcccc 




cgtgctcctc 


y v yy^ya **y 


*»y i*i*cgACwd 


4980 


ectggagegg 

23 23 23 23 23 




a ft ft ^ t* n fj f* r* rr 
yugLwggccg 


5040 


cgccgaacgt 


caccaacaao 


aeaGflflprrit* 
u^uv^y y w 


5X00 


tctgctcccg 




aegteggteg 


en 


e ecr fc cf e act fc fc 
w y y ww w 


r*» f rxrri ^ 

ctcycyotCC 


aegageggge 


5220 


t c exact a to a o 


wy uuy Li. L- uy 


ccgaagaggt 






gcaggccgcg 


agcagctccg 


5340 


ccgtcccctc 


wow wy y w 


gcgatgLCgu 


An 




ggcgaccgcg 


gtctggaaat 


5460 


<*y bayayyty 


gcccttctcg 


tggagatcca 


5520 


yaLCabCydb 


ggtggggtac 


tcgttccgcc 


5580 


ycycCLtyaa 


gacc tgeteg 


tcctcgcgcg 


5640 


fr<? eif r rra f a o 
yubyuyacac 


gatgegegge 


ggctcc ttct 


5700 


tcaggccgcg 


ctcgtacggc 


gtgcgcacgt 


5760 


gccgctcggt 


gggcaggccg 


ttgtcgtccc 


5820 


y v»» •••aa y • 


ctyycygacg 


acgacgtccg 


coon 


y ^uy vy ay ww 


c a tt a9 c y9 tc 


ggcggcgggg 


5940 


y y **vyy y w 


**r 3i ^ ^ frri ♦* s» « 
y uauuyy Ldc 


gtcccgtcgg 


bUUU 




y vcyadgtgo 


ttcgggagcg 


oU b U 


tgategtcac 




gcagaacaga 




cc tacgtcgt 


yyy ^y 


ccgctcaagg 


CT Oft 

DigU 


atcgcatccg 


cgcatccgcc 


agagcccggc 


£94 ft 


gagecgagag 

aaa a a 




ww ^.ccaggtc 




atcocooaoa 

w y w yy**y 


ygegggegea 


tegatcgegg 


C1£ft 


^^y *yy **y 


c u tgcggtgg 


acgccgagct 


o42 U 


ccatccgatc 


caocrceaGart 
*»«*yy*»i.yLag 


a tgaagacgt 




gc teceggta 


y «y w t>wyyyu 


d\— y tgegee t 




ooccoccoco 


c era fia or* rr f* rr 
*»y<*y "a ^-y tg 


at ctegtage 


c c nn 


cgagctcgtc 


yv»yy uay atg 


a /^f ^ ^ ^ 4* ^ V 

acgtcctccc 


O O OU 


ggggegegge 


cagccccoco 


e Cf e a crei cr a crrr 
tyt«gggdgg 


6720 


cggtgccggt 


cgcgacgaac 


aaoflaoffftfrt 
tt *yy<»yyycy 


6780 


cgtgcgggcc 


gatggegegg 


aqcqtqqcac 
"*y w y w a3 v 3 


6840 


ccgccccgcc 


ctgcacgagc 


qtaaccocaa 

y w y w ^y 


6900 


atqcqatqoa 
y y " w yy** 


ofcaocfGcrefie 
y *«**yy*>*ywyw 


4* a^nf it 
bbvaCCbCgC 




actggcccgc 


ctcgaacaga 


aacgacctcc 


7020 


cgaaagggct 


gaggggcegg 


geggegaega 


7080 


tggtegggge 


ccggcggggc 


teggctgega 


7140 


cctgcgcccc 


ggcccaatcg 


cgatcgccgc 


7200 


gegggaatea 


cgggcttccg 


ccccgtgcgc 


7260 


gcgctccggc 


ggggagccgt 


cgcgggctct 


7320 



22 



DE 198 46 493 A 1 



accgcacgcc catgcggcgg cgctgcggga tgttcaccgc cggccgggag cgatcctggt 7380 
tggggagcgc gcgcggcggg cggggatccc ggtgcgcggg cttctgcgcg gggagctgcc 7440 
ctcgctgagc cgggcgctgg tegggcgact tggccgagcc cagcgcgaga tcggagacgg 7S00 
ggagatgcgc gcgtcgctgc atagaatcct ccatggaatc ggtcatcaac acatcgggaa 7560 
gagcacccag gctgaaagaa accttcgaag aaccggctct catacaccct ccattcatcg 7620 
tgcgaccccg gattcaggac ggatcgaacc cgcgagggac gctggctctc tgggcctctc 7680 
cctgctcgct cgaccggcgc cctctcgacg caactccgcc gttcgtcggg acgggacggt 7740 
ccgcctcgcc gcacgctccc cgtcgagacg actcagcgtc tcgacgtcag gagagatgac 7800 
gactcggccc gtcgcgccac gacccttccg gctcggtgct tcgagcgcgc ggccagcgag 7860 
cgaggggcga tcgccaggag atcacgaatc tcccggccat cggcctccag cgcctcgggc 7920 
tcgttcgctc gtcgccccgc tccgtccccg cgcgcgcacg acgcgagctc gcgcggggaa 7980 
ccgcgggccg ctgtcgtggc tgctgatgcg cgacgataca ggggggacgc cgtgcctacc 8040 
tgggcaacag gcgctcatct tctaccacgg cgagcactac ggtgagtgct gccatgagta 8100 
ggcccctgag ggtccgcgcg acggagcgtg gtgtcagcga gagatgcgca tggtggacgc 8160 
gggctacgcg tcgagaggga cactagcact cgacctcgat cctgcccagc actttttgtc 8220 
ggggagggct gccctcccgc tggccgctgg ccgctggccg ctcgccgctg gccgctcgcc 8280 
gctggccgct ggccgctcgc cgctggccgc tggccatgtg cgacgtgagc tcgagcagcc 8340 
cgcggctgac ggacagaccc cggagttcat cgagccggtg atgccgaacc cgccaagcga 8400 
aaaaacgtat ccgttcggca ggtcgtggcc tatcatgcaa gctgctcgat gcgctgacag 8460 
gcttcttcga gatcctcgtc ggtctttgcg aagcaaaacc gcatgaagcg actcccctgc 8520 
gtcccttcaa agaaggcgtc gcctggcacg cccgccaccc cggtctcgtc gagcaagtag 8580 
atggctcgct ctcgacctgt cctcccgggt aggcgagaca catccgccag cacgtagtac 8640 
gtcccctgcg gcacgcaggg tggcaagccc gctttctcca gcgcccgaca gaaccggtct 8700 
cgcttccgtt catatccctg ggcaagcccc gtgtaaaacg agcgaggaag gccgcggatc 87 60 
ccggcagcga ctccatgctg cagcggcgtc ggegcgcaga catacagcag gtcgctcatg 8820 
gctccaatgg ccttcgccca cctggcatcg gccacgctgt agccgatccg ccatcctgtg 8880 
atgctgaagg tcttcgagta gccgcctatc gtgatcgtac gctcggacat gcgcggaagg 8940 
gaggcgacgc tgacgtgctc acggccgtcg aagataaagt actcgtaaat ttcgtccgtg 9000 
atcaccatga ggtcatggtg gcaggcgaga tcggcgatct gttccagctc cattcggccg 9060 
aacaccttcc cggaaggatt tccaggagag ttcaccacga tcgccttggt cttcggggtg 9120 
atcgcgcgct ccagctcgtc gccgtcgaca ttccagctca gggatcgcgc cgtcacatac 9180 
cgcggaacag cctcgacggc gaggatagcc tgggcgtgat aggcataaaa cggctcgaag 9240 
agcagcactt cgtccccagg attgagcaag gccatgcaag tggcctgaaa ggcccctgtc 9300 
gctccggcgc tcaccgtgat gtcagtctcc ggatccgccg cgatgccatt atggcgagcc 9360 
agcttcgccg cgatcgcatg gcgcagctcc acgatgccgt cgaagcgcga atatgtattg 9420 
cacccccgat ccatcgcctc cttcaccgct tgaaggatca ccgaaggaac tggggtatca 9480 
cagacgccct gggaeatatt gatcccatgg accttggcgc acgccagggt catggtacgg 9540 
atatcggact gggcgaggcg agccgcacga tcactcggta gactcttcat cagcgtgctc 9600 
ctgettctgt tctgcggctc tgcatggtgt cttcgggtgg gcttgtcage tcgacgcgcc 9660 
catgcagcgg cgcagcccta gcggccgcag gtctgtccac acttctttga tgaaagcgag 972 0 
aeattcggct ttcgtgccct gtttgcccgc agccctccag cccccaggta cgggcttgtc 9780 
ggcgggccag atcgagtact gctcttcgcc gttcaccacg acctggcaac gcgtcttgct 9840 
ttcgtcgtcc cgattcatga ttttcctcgc ccttcgtcag cgctgcgcga gcatgaaacg 9900 
aatcgctcat cggcgcacag gcgcgcgccg gctgcccgga ggcactccca cgcctccctc 9960 
acggcaacct catcgctccg gatgttcccg atggcgactc ggatcgtgta cctgocgtgg 10020 
agacgggtat gggacaaaaa taccctgccc gacttgttga cctcgtccag cagcgcctcg 10080 
ttgaggcgat cgagctcgcg ttcgatcgac tctctctctg cctcgtccgc cgaccgcatg 10140 
atgcaagcga gcgcggaggg cctcatgcga aagcagaccg tactgaacgg cgtcggcgcg 10200 
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aggcgctccc aatcgggatc ggcgtccacc cactgggcga gctgctgccc caatcggagg 10260 
tgetcccgga tccgggccgc cagcccttca tgcccgaagt agcgcacgat catccagagc 10320 
ttcagcgctc ggaagcgccg accgagctgg ataccccagt ccatgtaatt cgtgacgtcg 10380 
ccctcggtgc ggaggtattc gggcaccaga ctgaacgcgc gcttcagtcg gtcggcgtca 10440 
cgcacgtaga gcacgctgca atccatgggg gtgaacagcc acttgtgagg gttcactacc 10500 
agcgagtccg ccccctcgca gcccgcgagc acgtccctgt gctcggggac gatcgcggcc 10560 

10 atccccgcgt aggccgcgtc cacgtgaagc catagcccgt gctcccggca aacgctgacg 10620 
atggcgggga tggggtegac gctcgtcgtg gacgtcgtgc ccaccgtcgc cgcgacgcag 10680 
aagggtcgga ggccggcecc gaggtcctcc acgacggcgg cgcgcagcgc ctcggggacc 10740 
atgcggaagg ccggatccgt ggggatcttc cgcaccccct cctgcccgat gccgagggtg 10800 

15 atggctgcct tctcgatgga tgagtgcgcc tgctccgacg cgtagagtcg catgcgccgc 10860 
tgtcccgcca tgecccggag ccggatggtc ggcfccggccg agtcgcgcgc ggccgcgatc 10920 
gcgaccatgc tggcggtcga cgcggtgtcc atgatcgcgc cgtgcaagcc ggcgtcgaga 109 80 
tccagcatct gacgcagcca ggagaggacg agctcctcga gctcggtggc cgccggcgac 11040 

20 

gtgcgccata gcatcacgtt gacgttgagg cacgccgcga gcagctcgce gaggatccca 11100 
ggaccagacg ccgtgttcgc gaaatacgcg aagaatcgeg gatgattcca gtgcgtgatc 11160 
cccggcagaa tgatctgctc gaaatcggtg agcacggcgt ccatcggctc cggetcgacg 11220 

25 ggcggggtcg gggccagcct gcccttcacg tcgccggggc ggatcgcggg aaagacgggg 11280 
tatcgatccg ggtggccgag gtaatcggcc gcccaatcga tgattctcat accgatccgg 11340 
cggaactcct ccagatccat gtccccgagc cgttetttcc gcgggtcgct cacgtcaacc 11400 
tcctcgccct gccaggacag gatcctcgag gtcccctggc tccggcggtg gaaagcgctc 11460 

30 cttgaacgtg aaggcccacg gggtcggtcc gtagcgccgc aggtgctcga gccgatcctg 11520 
cccctcgcgg acggacggga tgtgcccggc cgggacccac cacagcacga ggtaatgcgg 11580 
ctcgagatgc tcgaaccacc gagcgcgctg tcgcaggaac gcggcatgat ecgcggtgta 11640 
ggtgaaggcg aacaggtgct cgatggaggt ccataccgac agggtcacga ggagccgctg 11700 
gtccgggtac ggacggatgg acacagagtt cccctcggcc gtctgcaggc gccacacgaa 11760 
cccctcgctc cgatcggcca gatggttgat atggtcgagc ccctggacga agccctccat 11820 
gatcggatcc tccagcggag cgcgaataca tgcgaagttg tattgcgcga tgtggtgccg 11880 

40 atgctccgac atgtcgcttt ccatctccag ctcccgctca ccaatcccag cgctgctccg 11940 
gggagctcat cagggcagac gcgacatcga tcccgaagct ccgccgcatc ccctcgacga 12000 
aggcggcctg gaccgcttcg gcgacggatc ggcctgcctc cggcaagacc tcggagacaa 12060 
agaagaaccg cctcgtggaa gggacaatct tgccccgctc cgcctggcgc catacgaagt 12120 

45 gcctcgtcac cagtccctcc gcgtcggcat acccgacctc gccggcgccg accgccacgc 12180 
tgccgcctga gccgagctcc acgaacgcct caccgcctcg cgagatctcg aggcgaacgt 12240 
ccgggccagc cagatcgccg aggtcccaag cgccgacggg gacggcgaac cgcagcgaca 12300 
ggaggttgta aaaatcgacg aatgcgttga tgtgcggcag ctctccacca ccgaggaccc 12360 

50 gcttcgccag cgcctcgatc gagctcggaa atttcttgcc agagaccccc actcgcttca 12420 
tcgcctcgcg ccaggcagcc acgtgcggat gcgactgggc gttttcgtgg ccccagctcc 12480 
gtcgcagctc ctcctcgacc ttccggagct cctccagcac ggccggccgc tctgcggcgt 12540 

55 tgtccaggcc ttccccgtac ccggtgacca agatcatccc aggaaacgac tcccagattc 12 60O 
gcggatcgac gatgaatgcc jatgtgcctcc tgcccctcga gagcgatcgc ctcgatcgac 12660 
accaggctgt ggatgcatga gccgggccgt gcggacgcag gaccccgcta ctcatggctc 12720 
ttcgtggccg atgaacaggt cctccacccg tcgatcgtgc tcggtgcccc gatccgtcca 12780 

60 gtcccacccg ccggcgaccg cgatgtttgc aeccgagaeg tacgaggcgc ggtcggaggc 12840 
gaggaacgcc acagcatctg cgacctcgct ggcgcgcccc aggcggccca tggggacgcg 12900 
ccgctccatc cactccttct gcgcgggcgg aaggtatccg ttgtcgatga gccctggaga 12960 
cacacagttg accaggattc catgaggcgc ctcctccgtg gccaggctgc gcgtgaggat 13 020 
gagcacgccg gtcttcgcga tcgagtacgc cgccacgttc ggcgcgccgc ggatcgcgta 13080 
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cgtggggctc aacccgatat tgatgatccg gccgctcttt cgctggcgca tgcgcgccac 13140 
ggccgcgcga cagaggtaat gaacgctgct caggttgctg tccatgacgt tgcgccattc 13200 
gtcgtcggtc atcgccgcaa gcggcttgaa gaagaagtcg cccacgttat tgacgaggat 132 60 
gtcgatgggg cccagctgcg cctcgacgct ggagaagagc tccgcggccg cgttggggcg 13320 
ggtgacgtcg gcctgcacca ccatggttcg tcgcccgagc gcgcggatct cggccgccgt 133 80 
ctgctcggcc gcatccttgt tcgaatggta attgacggcg acgtccgcgc cttgctccgc 13440 
gaggcgcagc gcgatcgcct tgccaattcc gcgcgagcta ccggtgacca gggcgacgcg 13500 
cccggcgagc tccagcgatc gcgcctgtgg cagggccgga gcagcctcct ggtggagctc 13560 
gacgtcgacg gggagctcca cgtggtagct cgtctctcgc ggagccgcgc agtacctctc 13620 
gtagaacgcc tcgaggacgg gctcttcgcg tcgcatgatg tccgcgtggg attcggcgct 13680 
gcgccacgga tagagcacca ggatctcgtc ggggcgcacg gtgctctgaa agaatcgcgc 13740 
atgaccgcac caccccgggt gttcgtgggc tcctgggccg agcagatcat ccattttttg 13800 
catgatctgc gtggcctcgc cctccatgcc gggtttgatg cgccatcgct ccataacgag 13 860 
gatcatgtct tggctcctgt tcgtcatcgc cgtttcgatc tgggggggct gcccgcgctc 1392 0 
tcgagggcgc gcecettgta ttggccgcgg atggtctggg tagcgctcgc gagctttcgc 13980 
ttgtgggcgg cgttcaggct tgcgccttga ttgacgaacc gctcgcagac gaatgcgtgc 14040 
gattcatatg cggtcgcgag cgcccacagg tagagacggt ggctacgago gagcttgggc 14100 
ggaagcgccc tcaaggcggg tcggatggat ttgagggtgc gaatcaagcg ggcgtgetct 14160 
tcgaagaaga gaccgctgaa tccatcctgg acgaacggcg gggccatggt aggtcgcacg 14220 
atgttgttgt aatcatcatt cgagaaatcg ccggtaaacc ggaaagatge cgccgttgcc 14280 
caccagagct gcgtggagat cgogagcgcc tctcgcgccc tcggaacgtc acggttggcg 14340 
agcgcctccg acagccacct gtgcgccatg agcagcgcct ggaccagcac gaagaacgcg 14400 
tgatgcccca atacccagcg gcccagcgcg ccgtccggag cgcccgcctc cgccggaggc 14460 
gcagccagct gcgggatgce attccatgat tttggccttc gcttgccgga gaactggtgg 14520 
aggatgtcct cgatggacgc acagagatgc cccatttcca tgggttgcag ggaagtacct 14580 
ttcaggcttt cgcggsitcat tcggtaatat gcgacgatca ccgcttcgca gtacgtctcg 14640 
agcgggtctg gggcggagac ccggtgcaca tggaaatagg cgtcgtactc cgcctcccgg 14700 
tccgacaggc tccccgggat gtccggatct gccgcttgcg cctgccatcg ctcgaggatg 14760 
gggacggcga ggggggcgag atgctcggcg agcaccgcca ggtcgccctc cggcgcatgc 14820 
gccaacaaga cctcgaaggc ctcggctgcg accttggagg tctcgcccat tccgacggcc 14880 
tcgatggctt ggggcagcgg tagatggatg gtatatttag ccatgatttg cccgaagatt 14940 
gccgctgcgt cgacagatct ttcgcgagcc ggaacgccat ttccactgct ctggctctca 15000 
atattgaatt gagccctggc gactgccata ggcccagtcg ctcgacacag tgtacggagc 15060 
ggcccgatgc tttctccttt tttagtcctg caccgaatac ttctgttggg cgccaaagat 1512 0 
cccttgccga gactgtccgg cgagatgtcg tgtgcgaagc gtccgcacgt ccagcgggcc 15180 
catgcgttgc tagagcataa aacggttcga tgcctggtcg agagggagac gcgaggagcc 15240 
tccctttggg acggatgagg aatttcgtga ccgaaatgtc ggcaggaaca gcggcgcaga 15300 
agcggcgcat cgatggggaa ccatgggtta cgaagacatt gatgataatg tcgacgcaat 15360 
cgcaatcgtc gcgatgagcg gccgcttccc cggcgcgaga aacgtcgagg agctgtggca 15420 
gaagctccgc gctggcgtgg aatgcgtcgt caccttcaca gaggccgagg cgctcgccgc 15480 
gggggtgaSfc cgcgagatgc tcgcgaatcc cagctacgtg cgcagaggcg cgccgctcga 15540 
cggcgtggag ctcttcgacg cctcgttctt cgggttcagc ccgagggagg cagagagcat 15600 
ggatccgcag cagcgcatct tcctggaggt cgcctgggag gccctcgagc gcgccggtta 15660 
cgaccccgat gcccattccg ggcctatcgg cgtcttcgcg ggcagcgccc cgagcggcta 15720 
ccactccctg gcgcagtccg acccggagat cctaggcgcc ctcggccact accaactgac 15780 
gctgaacaac gacaaggatt atctcaccac acacgcctcg tacaagctca atctgcgggg 15840 
cccgagcgtg tgcgtgcaga cgtcctgctc gacctcgctc gtggccgtgg tcatggcctg 1S900 
ccagagcctg ctcaaccacg agtgcgacat ggcgctcgcg ggtggcgtgg ggatccatgc 15960 
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gcatcagcgg aggggctatc tgtatcagga gaacggcatc tcttcgcccg atgggcattg 16020 
ccgcgccttc gatgtggccg ccaagggcac cgtgggcggc agtggcatag gcatcgtcgt 16080 
cctgaagcgg ctcgccgacg cgctcgccga cggcgaccac gtgcacgcgg tgattcgagg 16140 
agcggcgatc aacaacgacg gctcgagcaa gatcggttac accgcgccga gcgtgcaggg 16200 
gcaggccgag gtgatcggca tggcccaggc gctcgccggc gtggagccgg atgacatcag 16260 
ctacatcgag gcgcacggca cggggacgcc gctcggcgat cccatcgaga tcgcagccct 16320 
cacgcgcgtg ttccgggcga agaccgcacg aaggcagttc tgcgccatcg gctcgctcaa 16380 
gaccaacctc ggccacctcg atgccgccgc gggcgtcgcc tcgctgatca aaacggtcat 16440 
ggccctcgag caccgcgagc tgcccccgag cctgcacttc gagcgtccga atccgaagct 16500 
cgagctggag agcagccctt tc.tacgtcaa cacccgectc actccgtggc acgcggcacg 16560 
aggtccgcgc cgcgctggcg tcagctcgtt cggcatcggc ggcaccaacg cgcacgtggt 16620 
cctcgaagaa gctccggccc cgcctccgag cggcccctcg cggcgttggc agctcctcac 16680 
ectcgcggct cgctccgagg ccgggctcgc gcgggccacg gccgacatga tcgagcacct 16740 
cgatcgccac tccggcacat cgatcgccga tgtcacgtac acgagccacg tggggcgccg 16800 
ggcctggccc ttccggcgag cggtcgtcgg cgagagcgcc gcggatctcc gcgccgcgct 16860 
cgcgagcgag ggctcgccgc gctcgatctc gtcatgccag gcggcgaggg agaggcccgt 16920 
cgtcttcctg ttccccggtc agggagcgca gcacctcttc atggcgcggg agctgtacga 16980 
ggtcgagccg atcttccggc agtccctcga ccgctgcgcc gagctcctgc gcggcccgct 17040 
cggcctcgat ctgcggcagg tcctctaccc cgccgagggg cagcgcgacg acgccgagea 17100 
ggagctcggt aggaccgcga tcgcccagcc cgcgctgttc gccatcgagc tctcgctcgc 17160 
caagctgtgg atggcctggg ggatcgtccc ccaggcgatg atcggccaca gcgtcggcga 17220 
gttcgccgcg gcttgtctgg cgggcatctt ccgcgaagag gacgcgctcc gcctcgtcgc 17280 
cgagcggggc cgcctgatgc aacagatgcc gcccggcgcg atgctggcgg tgcccctcgc 1734 0 
ggagcccgag ctcgccccct acctcagcga cgacatctcg ctcgcggcga tcaacggtcc 17400 
ggctctctcg gtggtcgctg ggccgatcga ggccatcgac gcgctcgcgg ccgagctctt 17460 
ggaccacggg ctctcgtgcc ggcgactcca cacgcggcac gccttccact cgaagatgat 17520 
ggcccccgtc gttgacgcct ttacccgatg cgtgtccgcg gtcgagcgcc gcccgccgtc 17580 
aggccacttc ctctcgaccc tgacgggcgg ctggatctcc cccgaagcag cgaccatccc 17640 
cgcatactgg gcccggcagc tcgtggagcc ggtgcgcttc gcccaggccg tgaggcagct 17700 
gctgtccgag tcgacgtggc tctggctcga gctgggtccg ggccagaccc tgagcccgct 177 60 
cgtacggcag caggcccgcg cggatggcgg ccaggtggtc gtcgcctcgc tgccgcgcgc 17820 
gaaggacgcg ggcgccgacc acctcgcggt catcgaggcg ctcggccgtg tctggagcgc 17880 
tggtgggacg gtcgactgga agcgctttca cgagggcgag gcgcggcggc gggtgctgct 17940 
accgacctac cccttcgagc ggcaacgata ctgggcctct ccgcgccaca cgagcgctcc 18000 
gccggaagcg ataatcaagc cgctcctcgc gaagaaccca aacgtcgccg attggttctt 18060 
cctccctgcc tggcggcgct cggatcetcc ggtctcgttc gacgcgcagg cggtgaccac 18120 
gcggcgctct acgtggctcg tcttcatcgg ggacgagggc ctcggcgcgg cgctggtgga 18180 
gggcctcgcg cggcgggggc acgaggtcgt cgcggtggtc acgggtgaga ggttcgagca 18240 
gacgggcacg cagcgctaca cgatcgatcc cgccgcgaat ggcgatgttg cgtccctctt 18300 
cgcgcggctc gaaatcgaag ggcgcatgcc ggaccggatc gtccatgcct tctgcacgtc 18360 
gcctgcggac ggcgcgcgca tcgagcgcgg agccgcgctg gagatcgagc gcaggctggg 18420 
cttcgatagc ctcctcctcc tcgcccaggt gatcgccgca caaaggcatc cgaagccgct 18480 
gatgctcggc gtgatcacga cccgggcgca ctccgtcatc ggaaccgaga tcatcgagcc 18540 
cctgcgcgct ctggtgctcg gcccctgccg cgtcatcccg caagaaatac cccatgtctc 18600 
gtgccggaac atcgatatcg atctcccggg cgaaggcggg. cgcgcggaga tcgcggcgcg 18660 
cctgatcgcc gatctggagc gagagtcgcc cgactcggtg gtggcctacc gcggcggccg 18720 
gcgctgggtc gagagcatag agctcaccga tgtcggccgg cggtcagctg gcgccgcccc 18780 
gcgcctccgc cagcgcgggg cgtacctcat taccggcggc ctggggggca tcggcctcgt 18840 
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ggctgcagag ctcttggccc gagaggcgca 
cctgccagcg cggcaggggt gggacgactg 
gagccgaaag atcctccgga tccgcgcgct 
cgcggccgac gtctccgatt tcaatgcgat 
cttcggccgc atcgacggcg tcattcactc 
gctcaggacg ccgatggcgg cttggcgcgt 
gctcgatgcg ctcctccggg acgagcgtcc 
ctcgetggtc ggcggcgcca cccagatcga 
ctacgcgcag agccgcgagg gcgaggaggg 
gtggagtgac gtcgggatgg cggtggactt 
ccgcgagagc ctgaagcggg gcatcagctc 
cttgagcgca ggcatgagcg gcccgctggc 
gcagtctgtc acgacacgcc gatcgcagca 
ctcgcgccca acgaccacgg gagcctatgt 
cgccgcgatc tggcaggatc tectcggcct 
ccagctgggc ggccattcgc tgttggccac 
caaggtgggg atctcgttgc cgcagttctt 
cctggtcgac gcagcacggg ccgaaggcgc 
cgagcgagac gcctaccgaa tcaagccgcc 
gtaacaagaa ggggatcgag tcatggaacc 
aaagcagcag gagacctgcg tcttcccgac 
cgaccagctc gagccgggga gcgccgtcta 
gccgtacgac gtcgactcgc tcgtgegcag 
gctgcgcacg accgtcgatg fccatcgatgg 
gcgcatcgag gtgcccgtcg tggaectgag 
ggcccggcgg ctcatggcgg aggagagccg 
gctccgagcc aagctgctcc. ggctcggcga 
tcatatcgtc tccgacggct ggtcgatgga 
cgccgccttc cacgagggcc gcccgtcgcc 
cttcgcggtg tggcagcggg agctgctcca 
ctggagagag. cacctccgcg gcgcccccac 
gccgccggcg cagacgttcc ggggctccca 
acaggcggtg caggcgctca gccggcagga 
ggcgttcagc gtgctgctct cgcgttatgc 
catcgcgaat cgcacccgag cagagctgga 
ggcgctgcgc atcgacctcg ggggcgaccc 
ggaggtgacg ttgggcgcct acgcgcacca 
gctgtcacca gggcggagcc ccagccacag 
gaacaccccg atggatgcga cgaacagagc 
ggaaatgaag gcggcgaaat tcgatctgat 
gctcggcacg ttcgagtaca acaccgacct 
cggccacctg gaggtgctgc tctccagcgc 
gctgccgctc atgggggccg aggagcgcag 
cgcgctgtat cccgaggacc attgcatgca 
gcccgaggcg accgcggtgc tcctccagca 
gcgcgccaat cagctcgcgc atcacctgcg 
cgggttgtat ctcgaacggt caatcgagac 
tggcggggcc tacgtgccgc tcgatccgac 



cgcacggetg atcctggttg ggcggacagg 18900 
gctcgcggcg cacggcgcgg gcgacgcgac 18960 
cgaggaggcc ggcgccgagg tgaagatcgc 19020 
gcggagcgtc atcgaggagg cccggacgcg 19080 
cgccggcatc gcgagtggag gcatgatcca 19140 
gatggcgccg aaggtcggcg gcacgctcgt 19200 
cgacttcctc ctgatctgct cgtcgttggc 19260 
ttactgcgcc gccaacgcct tcctcgacgc 19320 
atgccgcgtc atctcggtgc aatgggacac 193 80 
caagctcccg gccgatctcc aagaggggcg 19440 
gagcgagggc gccgaggtgc tcggccgcat 19500 
gatttgcacg tcggatctac cagcgtacaa 19560 
egagcaaact cccgccgccc ggccgatgca 19 620 
cgctcccgag accgagaccg aacggcgcat 19 680 
cgagcaggta ggcgcaaacg acgatttcct 19740 
gcaggtcctg tctcgcgtcc tgcagaccct 19800 
cgatgcgccg acggtcgcag ggctttcgcg 19 860 
cggacccgtc gcgccggcaa tcggcegtgt 19920 
cgcggccgaa caggccgccc gcaccaagcc 19980 
cgtcggcggc gtggacatga atcagcccgc 20040 
ctccttcgcg cagcggcggc tctggttcct 20100 
caacatgccc gcctccttcc ggacgcgcgg 20160 
cgtgaacgag atcgtgcggc gccacgagtc 20220 
cgaacccgtg caggtgatcg ccccctcgct 20280 
cgagatcgac gagccggagc gagaggcgga 20340 
ccgccccttc gatctcacgc gagggccgct 20400 
ggccgatcac gtgctgatct tgacgatgca 2 0460 
cgtgctgttc aaggagcttt ccacgctcta 20520 
gctcccggag ctgccgattc aatacgccga 20580 
gggcgaagtt ctggaatcgc acctcgggta 20640 
gctgctggag cttccgatgg accggccccg 20700 
gcgcgcgttc cgactcccac tctccctgca 20760 
aggcgcgacc cccttcatga cgctgctgac 2 0820 
gcggcagagc gatctggtgg ttggcacgcc 2 0880 
ggggctgatc ggcttcttcg tcaacatgct 20940 
gagcttccgc gagcfcgctcg ggcgggtgcg 21000 
ggacctgccc ttegaacggc tggtggagga 21060 
ccccttgttc caggtgtcct tcacgttgca 21120 
agacattgca tcgggtggcg cgccgctggt 21180 
cetggagctc tcggaatcgc cgcaagggtt 21240 
gttegacgcc ggcaccatcg agcggatggc 21300 
cgtcgcggcg ccggatcgac ccattgcgga 213 60 
tcgggtattg gtggagtgga actccactgc 21420 
cgagctgttc gagcagcaag tggagcggtc 21480 
gcagacgttg acgtatcgag agctgaacat 21540 
gagcctgggc gtgggcccag aggtgcgcgt 21600 
ggtcgtggcg atcctcggcg tgctcaaggc 21660 
gtaccccagc gagcgcctcg ggctcatgat 2172 0 
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ggcggacgca gcgccctcgg tgctgctcac gcaggcgtcg ctcctctcga agctgccgcc 21780 

ccacggggat gcaacgctgg tacagctcga cgcgctgcac gaagcgctct ccaggctgcc 21840 

acaccatacc ccgcggagcg gcgtcaccgc ccagaacctc gcatacgtca tgtacacttc 21900 

cggctcgacc gggcggccca agggcgtgct cgtcgagcac cgcggcctct gcaacctgcc 21960 

caccgtgcag gccaagctct atggaatcgc gccgggcgac aggctcctcc agttcgcgcc 22020 

gctctgcttc gacacatcgt tctgcgagat cgcgctcgcg ttgctctcgg gagcgacgct 22080 

ggtcatgggc acggcggacg agcttctccc gggacctccg ctggtcgagc tgctgaagaa 22140 

gcacgcggtc acggcgatgc tcctggcccc taccgtgctc gcagcgctgc cagaacaaca 22200 

gagcgcggcg ttgccgctgc gcgtgctcac gatggccggt gaggcgtgcc cggcggagct 22260 

cgtcaagcgc tggaaggcac ccggacggcg cctgttcaac tcctatggcc cgaccgagac 22320 

gaccatttgg gcaagctccg cagcggacct gtccgacgaa cggatcccgc ccatcggccg 22380 

tccgattgcc aatacgcaaa tctacgtgct cgacgaagcg ctcgagccgg tgcccatcgg 22440 

cgtgccgggc gagatcttca tcggcggcgt gggcgtcgcc cggggatatc acgggcgtcc 22500 

ggacctgacg gccgagcgat tcgtacccga ccccttcggg caaaccaaag gggcgcgcct 22560 

gtatcggacc ggcgatcggg cgcgctggct gccggacgga aacctcgagt ttctcggtcg 22620 

aaacgacgag caggtgaagg tccgcggtgt ccgcatcgag ctggaggaga tccgcgcggc 22680 

gttgctcaag cacccggcgg tcgctcaagc cgtggccgtg gtgcgcgagg acacgccggg 22740 

2 5 ggacaagcgg ctcgtcgcgt atgtcgtcgg acgcggagga gcgcgcgtga ccgccgcgga 2 2800 

gctgcgccag tccgtgagcg agcgattgcc tgcgaccatg gtgccatcgt ccttcgtggc 22860 

gctcgacgcc ttgcccctga cgccgaatgg caaggtggac cgccgcgcgc tgccggagcc 22920 

cgagcagagc gccggcggcg aggaccacgt cgcgccgcgc aacgccgtcg aggaggagct 229 80 

cgccaggatc tgggcgagcg tcctccggct cgaaagggtc ggcgtccacg acaacttctt 23 040 

cgagatcggc ggcgactcga tcctgagcat ccagatcgtg gtgcgcgcgc agcaggcagg 23100 

gctgcgcctc accccgcgtc agatgttcca gcaccagacc atcgccgagc fcttcgaccgt 23160 

ggctagagcc gtcgaggcgg tccacgtcga gcaggacccg gtgaccggtc ccgcgccgct 23220 

cacgccggtg cagcgctggt ggctggagca ggaggcggcc gagccgcacc acttcaacca 23280 

gtcgatcttc ctcgaggtac gcgagcggct cgacgagagc gcgctggagc aggccatcgc 23340 

gcatctgatc gaccaccacg acgcgctccg gttgcgcctc gcgcgcgacg aacgcggcgc 23400 

ccacc^ggtc ttcgccgcgc cgggaggctc gaccccattt cagcgcgtcg acctcggggc 23460 

gctgcccagc gccgagcaga tctccgccat ggagaaggcc gcgagcgagg cgcaggcgag 23520 

cctcgatctg gccgcgggcc cggtcgtccg cgccgtgctc ttcgacctcg gcgaggtcgc 23580 

cccgcaacgg ctgetcgtca tcgcccacca tattgcggtc gacagcgtct cctggcggat 23 640 

45 cctgctcgac gatctctttg gggcctatga gcaggcgcgc cgcggcgagg ccgtacgcct 23700 

gccgcccaag accacgtcgg tcaagcgctg ggccgagctg ctcaccgagc acgccggctc 23760 

cgaggccgtc aaggcggagc tcggctactg gctcgactea tcgcgacgaa cggtagetcc 23820 

gctgcccgtg gatcgacggg ccggcgagga cgtgtggggc tcggcgcgcc acatcgtcgt 23880 

ctcgctcacg ccggagcaga cggagcagct cctgcgcgag gtgecgcagg cgtaccgcac 23940 

acggatcgac gacgcgctcc tcactgcgtt cgcgcaggcc atcgctcggt ggacgggctc 24000 

gccggcggtg ctcctcgacc tcgagggtca cgggcgcgag gagctcgccg gcgtagacct 24060 

55 cacgcgcacg gtcggctggt ttacggccat gtacccgatc ctactccgcg tcgacgcggc 24120 

ggatccgggt gaggegctca aatcgatcaa ggagcagctc cgcgccgtgc caggccgcgg 24180 

gctcggctac ggcttgttgc gttaccttcg gtccgatacc atcgccgagg tcegcgcgtt 24240 

gccgcaggcc gagctctgct tcaactacct cggccagctc gatcaggcga tccccgagge 24300 

tgcaccgttc cggccggcgc gcgagtatca aggctcggag cgcagccccg gcgcccatcg 243 60 

cgcccacctc atcgaggtga acgcgagcat cgccaatggg cgcctgtacg ccacgtggac 24420 

gtacagcgag cgccgccacg agcccgaaac catcgagcgc gtcgcggcga gcttcgtcac 24480 

ggcgctccgc gcgctcatcg cgcacfcgcac cttgcccgag gtcggcggca acacgccttc 24540 

cgacttcgac aaggtgcgcc tgcgccagga gaccatcgat gctctcgacg caatcgacgc 24600 
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gggccccggg ccgtctgcga gggggagccg aatcgaagac gtctacccgc tctcgccgct 24660 
ccaggagggc atcctgttcc acacgctcta cgccaccgat tacacggcgt atgtcgagca 24720 
gttccactgg acgctggagg gcgatttcga cgccgaggcg ttcacccgcg ccctccagga 24780 
cgtcgtcgct cggcatgccg ccctgcgcac gtcgttcgcc tgggagcgcc tcgatgctec 24840 
acttcagatc gtccgcacgg gcgcggtcct ccccgtcgag caccaggacc tacgcggcct 24900 
cgccgcggag gagcagaccg cgcacatctc cegttacgtc gaggcagagc gccagcgccg 249 60 
gttcgatctg cgaaaggcgc ccctcatgcg cgccgggctg ctccggctcc gcaaggacgc 25020 
ctggtgcctc gtcgagacca tccaccacct gatcctggac ggctggtcga cacaaatctt 25080 
gctcaaagaa gtgttcacge tctacgaggc gcaccgcgga caccgtgggc atctcgcgct 25140 
ggagctcgag cagccgcggc cctacggcga ttacatcggc tggctcgcga agcaggacca 25200 
ggtgcgcacc gcggccttct ggcggcgcga gctcgagggc ttctccgcgc cgacgccgct 252 60 
cggcgtcgac cgcgctgtgc cgcacgacga cggcggcccg cggtttggtt ggcgccgcat 25320 
cgccctctcg ggcgacgacg cggcccggct cgccgccttc gcgcgtcagc atcagctcac 253 80 
gatgagcacg ctggtgcaag gcgcgtgggc gctgctcttg tcacgctaea gcggcgatcc 25440 
cgacgtgctc ttcggtatga ccgtctcggg ccgctcggcg ccgattcccg gtatcgagcg . 25500 
catgaccggc ctcttcatca acaccattcc ggtgcgcgtg cgcgagcctg ccgacgcgtc 25560 
ggtgctcgcg tggctcaagg cgctccagga gcacgaggca gagctgctcg agcacgagca 25620 
cagcccgctg gtcgaggtcc aggcccatag cgacgtgccg cgcgggaccc cgctcttcga 25680 2 5 
gagcctcgtc gtgttcgaga actacccggt gcaggtcatc ttcgaggccc ctccggtcga 25740 
ggggccgacg cgcgcggagg agggcctccg catgatcgat gcgcagtata tcagtgatcc 25800 
accgtatccg ctgacggtcg tcgcggcctt ccatgggacg ctttatctca atattggcta 25860 
cgagcgccgc cggttcgacg accaggccgt cgaacggatg atcgggcacg tcacgacgct 25920 30 
gctccggggc ttcgtgcaga ggcccgagac gtcggtccgc gatctgccgt tgctgacggc 25980 
cgaggaggag cgcacccagc tccacgcgtg gaatgccacg gccgcgccgt atcccgaggg 26040 
ccattgcatg cacgagctgt tcgagcagca agtggagcgg tcgcccgagg cgaccgcggt 26100 
gctcctccag cagcagacgt tgacgtatcg agagctgaac atacgcgcca atcagctcgc 26160 
gcatcacctg cggagcctcg gcgtgggecc agaagtgcgc gtgggcttgt gtctcgaacg 26220 
gtcgatcgag acggtcgtgg cgatcctcgg cgtgctcaag gcaggcgggg tctacgtgcc 26280 
gctcgacccg acgtacccca gcgagcgcct cgggctcatg atggaggacg cggcgccctc 26340 
ggtgctgctc acgcagacgt cgctcctctc gaagctgccg ccccacgggg atgcaacgct 26400 
ggtacagctc gacgcgctgc acgaagcgct ctccaggctg ccacaccata ccccgcggag 26460 
cggcgtcacg gcccagaacc tcgcatacgt catgtacact tccggctcga ccgggcggcc 26520 
caagggcgtg ctcg.tcgagc accgcggcct gtgcaatctg cccaccgtgc aggccaagct 26580 45 
ctatgcaatc gcgccgagcg accggctcct ccagttcgcg ccgctctgct tcgacacatc 26640 
gttctgcgag atcgcgctcg cgttgctctc gggagcgacg ctggtgatgg gcacggcgga 2 6700 
cgagctcctc ccgggacctc cgctggtcga gctgctgaaa aagcacgcgg tcacggcgat 26760 
gctcctggcc ccttcggtgc tcgcagcgct gccagaacaa cagagcgcgg cgttgccgct 26820 
gcgcgtgctc gcgatggccg gcgaggcgtg cccggcggag ctcgtcaagc gctggaaggc 26880 
acccggacgg cgcctgttca actcctatgg cccgaccgag accaccattt gggcaagctc 26940 
cgcagcggac ctgtccgacg aacggatccc gcccatcggc cgtccgattg ccaatacgca 27000 
aatctacgtg ctcgacgaag cgctcgagcc ggtgcccatc ggcgtgccgg gcgagatctt 27060 
catcggcggc gtgggcgtcg cccggggata tcacgggcgg ccggacctga cggccgagcg 27120 
attcgtaccc gaccccttcg ggcaaaccaa aggggcgcgc ctgtatcgga ccggcgatcg 27180 
ggcgcgctgg ctgccggacg gcaacctcga gtttctcggt cgaaacgacg agcaggtgaa 27240 60 
ggtccgcggt atccgcatcg agctggagga gatccgcgcg gcgttgctga agcacccggc 27300 
ggtcgctcaa gccgtggccg tggtgcgcga ggacgcgccg ggggacaagc ggctcgtcgc 27360 
gtatgtcgtc ggacgcggag gagcgcgcct gaccgccgcg gagctgcgcc agtccgtgag 27420 
cgagcgattg cccgcgacca tggtgccgtc gtccttcgtg gcgctcgacg ccctgcccct 27480 
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cacgccgaac ggcaaggtgg accgccgcgc gctgccggag cccgagcgga gcgccggcgg 27540 
cgaggaccac gtcgcaccgc gcaacgccat cgaggaggag ctcacacgaa tctgggeega 27600 
cgtacttggg gcaaagcggg tcggtgtgca cgacaatttc ttcgatctcg gcggccattc 276 60 
cctgctgctc gtccgggtgc atgatcggct cggccagcgg ttcgatcggc cgccctcgat 27720 
ggtcgacctc ttcacctatc cgaccgtggc gtcgctcgcg cggttccttg gcgaacgggc 27780 
gaacggcaag caatcgccga gggaggcegc ggcggacgtc acggagcgcg gccggcgccg 27840 

lQ cctggaggcg cgggcgcggc gggcgaaggc catccgtggc ccgacctgac ccgggcaccc 27900 
ttccaagccc cgccgttcct cgcacatccg ccgcctcgag cgccgcgtcc agcgccgccg- 2.79 60 
ttcgccgacg aggaggcgcg agacgacggt ccaaggcctt cgtgggctct ttgccccgca 28020 
atccggaagc tgcgcggcag ttcgtcgccc ctgcaatgct gccattgtag agctcctccg 28080 

IS ctcgccgcgg cctcttttct tgcggcccgt ccgcgattga cctcacatcc tgatcccttc 28140 
ttgcgtcgtc cagaaagtga ttgacggcca gcgccgcgct tgagatctte cggcgcgcgg 28200 
cgatttcatc gctccggcgc gccgtgactg tcacctgcga agggattata atgaaacata 28260 
acattgggtg gcttctaccc gccgccctcg cgacgcttgc cttcgtcccg gcctgcagcc 28320 
cgaatcacgg tgaggatgcg ccctccgtga cgtcagcaga gagcggcgcg gcgccgagcg 28380 
ctgactgcgt egcgetcggg gcgaagctcc aggcggcgct ggacggcgcc gccgccgcgc 28440 
aaaaggctcc gggagccgca gcggcggtcc agagcgggga ctgtgtctgg cggggcgcca 28500 

25 cgggcgtctc ggacctggtc gcgagcacgc cgacgaagcc tggagatctc tttcggatcg 28560 
gcagcatcac caagaccttc gtctctacgc tgatactcat gctccgggca gaaggccggt 28620 
tgtcgctcga cgacgcggtg tcgaagtatg tgaagggcat ccccgccggc gaccagatga 28680 
cgctgcgcca gatcctcggt cacacgagcg ggctcttcga ttacacgtac ageccggcgc 28740 

30 tcggccaaat gatcgaggtg gatccgaccc gcgccttcgc gccggcagag ctcatcgccc 28800 
tcgccacggc cgaggcgccg tatttcgcgc cgggcgcggg ttttcgctat tcgaacacca 28860 
attacatcgt ggccggcctg gtggccgagg cggtgtcggg cgggacgctc gccgggctgc 28920 
tccgcacgcg catcctagac cctgtgggcc tcgcgcacac gtatctggac ggcgccgagc 28980 
cgccggtcca agggctcatc cgcggctacg gcgactacgg cgcgggcttg gtcgacatca 29040 
ecgaccagct gtcgcccacc gaggcgtggg ccgccggcgc cctggtgtcg aacgtcgatg 29100 
acctcaatcg cttctttgcc ctgctcatca gccacgagct gctctcgtcg gacgagcttc 2 9160 

40 aggacatgac cacctggacc ccgacgatgt ggccccacga gcccggatat ggcctcggcc 29220 
tcatcgagcg cgattctgcg ctcggctccc tcaacgggca ctgcggaatc atctggggct 292 80 
ttcaatcggc gtcgtacggg gtgteccggcc gcggcgacgc gatcaccgeg ctcatcaacc 29340 
ggagcgacgg cgacgcagcg cggctcgtcg acgagctcgc gaaggtcgtg aaagagcgct 29400 

45 gatcgaggcg gaatgggagc gcttcggcgg gtggtgatgg cgcccggcgc tcagaacgcg 29460 
acgcgcagcc ccgcgctcag cgggcctgcg ccgggcgacg cggccacggc gcccggaccg 29520 
acgaggagcc gcgcgacggc gggcgcgctc ggcgcgtcgt ctcgccgcac ccgccgcttg 29580 
ccgaacacgt agagcggcag gccgacggcg accccggcca ccccgccgag cgcggtggcg 29640 

50 atcgccacct cggacgcctc ggcgcgcgcg gcgctgctgt cgtcgtggct cgcgaagacc 29700 
agcaccgcgc cgctgaggat ggcggcgccg cccagggtcg tgaggacgag ccccgagatc 29760 
accatgaccg ggctgttcca ctccgtcgtc cgctcctcga agtcgcggaa cgccgccctc 29820 

55 gccgccgcga gctccagctc gatccggcgc tgctcggcgc gccgctcgte cgcggagccg 29880 
atctcgtgga cgcggcgggc ctggccctcc agcgccgcga tgcgegcctc gtgcgcggcg 29940 
gcggtctcct cccacgtggc ccctggcggg acccccgcca cggccggcgc gacagagggc 30000 
gccgacgccg gggtcgaggc gggcgccgcg ggcggctccg cggceacgga aggcgccgcc 30060 

60 gccgcgggag gcgcgggcgg ctccgcggcc acggaaggcg ccgccgccgc ggaaggcgcg 3 0120 
ggcgactccg cggceacgga aggcgcggcc gccgcgggag gcgcgggcgg ctccgctgca 30180 
aeggagageg cgggcgccgc ggcagecagg cccagcgccc acgcgacgac acgacggcgc 3 024 0 
gccgcaaccg cgcgcgggcg cgegaagegg aggtggacct gctccatgcg cgcagcgtcg 30300 
cccctcgaca gggccgggtc aaggcgcggg agtccgagag cacgagacct ccgcgccgca 303 60 
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ggaaacaggc gcgccggcgg cccgcgcggc ggctcgccg.c tcacccctcg cgcggccggc 30420 
cgcggcgccg cctcccctcc ccggcgggcc gcgcgtcggc ggccacgcgg agcagctcct 30480 
ggaagtgccg ctccaccggg ccgaggtcga tgccgtccat gaacgacgtg. aacgcgaagt 30540 
acggcagcag cgtctgccag gcgcgcagcc agcccgggag gtagcgcggc cgctccagca 3 0 600 
cgccggcggc gcgcagctcc gccagcaccg cgatgtcgtc gagcgcgatc cggccgcaca 30660 
cgagcagctc cacctcgtcg cgcagcccgc cgcgaaggac cgcggccagg aaggcgtaga 30720 
cctcgagcag cccggccagg tagcaggcgt ccttggtgaa cggcgcgccg ccctcgacga 30780 
gcccgccgcg gcacacgcgc tgggcgtcga agtaggcgtc gcggcgctcg gcgccgcgct 3G84 0 
cgcgcaggtg ccggtacagg tcgaggaagc tcgcgccctg ctcggccatg tccacgagcc 3 0900 
gcacccgctc ggcgagccgg gtgaggcggc cgatggagag cgageggctg tagagctcgg 30960 
cgaagatggc gagcccctcc tgcgtgcgcg tggtgcgggg gccgcccgag cgcaggaacg 31020 
cgcaccgcgg ctgcgccgcg ccgttgtgcg cggtgagcgc gtgcgtctcg acctcgtggt 31080 
gccacagccc ctcggcctcc cacgccgcga aggtcgcctc cggccggatg cggacccggc 31140 
tcatgccggc gaccaccttg gccgtgacgc gcgggtcgac ggtgatctcg aggtcgagcc 31200 
gcggcgcccg gccggccacg cgggcggcga geatgteccg gagcgcgcog gcgtcgagcg 31260 
gctcctcctc gggatcgctg gcctcgtccc agccgtggac gcgcaggcgc tcggtgaggt 31320 
gctcggcgag gtcgatgttc ctgagcgagc cgccgaagaa ccgcgagcgc gcgccgccgt 31380 
agagctcctg cgaccgcgcg gagaacgcgc gggtgcccgc ggcctcgagc agctccgcgg 31440 
cctggatctg cgcgcggacg ttgtcccgca gccagccgag cgccggcgcg tccccgtcga 31500 
tggccccgag gagctcgcgc agctcggcga cgcgccgcgc gaggccgtcg cgatcgacgc 31560 
ggtactcgac ctcggggagg cggtcctcgc cggcggcgaa gaagcgctcc tccacctcgc 31620 
gcggccaggc gatgtcctcg agcagcttga gggccttgcc ctccgccagg cggccgccca 31680 
cccgatcgag ctgctccagc acggcgcggt cgatgctcat cgagcgcagg atcgccgaaa 31740 
ccgcgagacg ccggaaccgt cattccctcg acgaggcagc gattgccatg ttccgtcgct 31800 
ttttggagcg ccgtcgtcgc gctcgcctgc gggctccggc gatccagcgc ggttgcatgc 31860 
agcgagggtg ttccggggct ggctcgagag cgtcctttgg cccacacccg agacacgaat 31920 
gctccgcgcc gagcgcggtt gaccgtggac ccgccggaga gccgatgata cggtccggcc 31980 
gatgtcggag agtgtagctc aactcgaaga acaccgcgcg gcgctcaccg gacactgcta 32040 
ccggatgctg ggttcggtgg tcgacgccga cgacgccgtc caggagacga tggtgcgcgc 32100 
ctggcggagc ctggataagt tcgacgggcg ctcgtcgctg cgcacctggc tgtaccgcat 32160 
cgcgacgaac gtctgcatcg acctgcgggc cgaccgcgcg cgccgggcgc gccccatcga 32220 
ggaaggcccg gtcggcacgg tggacgacgc gctcgagacg cgcccgcgca cccactggct 32280 
ggagcccgtc cccgacgcgc acgccctgcc ggcgg;acatc gacgccgcgg agcgggcgat 32340 
gctccgccag agcatccgcc tcgcgttcgt cgcggcgctc cagcacctgc cgccgaagca 32400 
gcgcgccgcg ctgctgctca cggaggtgct cggctggtcc gccgcggagg tcgccgacag 32460 
cctcaacacc tcggtcgccg cgatcaacag cgcgctccag cgcgcgcggg cgacgctcgc 32520 
gagccgcgat ctcggcgacg cgcgcccctc gctgccggag ccgcagtccg cgctgctcga 32580 
ccgctacgtc aacgccttcg agcggtacga cgtcgacgcg ctcacggcgc tgctgcacca 32640 
ggacgcgacc ctgtcgatgc cgccgttcac cctgtggctc cgcggccacg agtcgatccg 32700 
cgcctggctc gtgggcccgg gagcgggctg ccgcgggtcg cggctcatcc cgacggcggc 32760 
gagcggctcg cccgcgttcg cgcagtatcg cccggcgccg gagggcggcc accgggcetg 32820 
ggcgctcatc gtcctcgacg tcgcggggga ccgcatcgtc agcatgacgt ccttcctcga 32880 
caccgagacg ctcttcccg.c ggttcggcct gccgctcgat ctaccggcgt agccgcgggc 32940 
gccctgcctg cctcgccgcg ggtgccctgc ctgcctagcc gcgggegccc ggcctggcca 33000 
cgggcgcccg gcctggccac gggcgcccgg ccagcgacgg ggcgacgatt tttttctgag 33060 
cgaccgatga gtcctgacgg ggccgggggt ctacgggggt gaatccaaca cggaggcacc 33120 
catgaccgtg accatcgcca gcatcgatca tcgtgaccag gacctcatga ccgggcccca 33180 
ggccaaggcg ccggcccgcg cg:gcggcgcc cgacgcggcg ccgtccaggc gagccgtgtg 33240 
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ggcgggccgc gtcctgagcg ggctggccac gctgttcctg acgtt<=gacg ccgcggtgaa 33300 
ggtgctgaag ctgttccccg cggaggcgtc gaccgccgag ctcgggttcc cggcgcacct 333 60 
cgtccccacc ctcggctacc tccagatcgc ttgcctcgtg gcctacctga tcccgcgcac 33420 
cgcggtgctc ggcgcgatcc tgtggaccgg ctacctgggc ggcgcgatcg cgatccacgt 33480 
gcgggtcgag aacccgctct tcagecacac gctcttcccc atctacgtcg ccgcgttcct 33540 
ctgggcgggg ctctggctgc gcgaccgccg cgtgcgcgcg ctgaccgcga gcccgtcgtc 33 600 
gcagggccga tgagcttcac gtttcacgag agtccatcac ggtaaaagga gaagcgagcc 33 660 
atgaccacaa agaacccccg caagctcttc gtcaacctgt ccgtccgcga cctgaagcga 33720 
tcgatggagt tcttcagcaa gctcgggttc gagttcaacc cgcagttcac ggacgagaag 33780 
gccgcctgca tggtcgtcag cgaggaggcc tatgtcatgc tcctcgtgga gtcgttcttc 33840 
aagacgttca tgaagaagga gatctgcagc acgagcacgc acacggaagg gctcttcgcg 33900 
ctctcgtgca gcagccgggc cgaggtcgac gacatggtga agaaggcggt cgcggcgggc 33960 
gggtcgcacg cgatggatcc gcaggatcac ggcttcatgt acgggtggag cttctacgac 34020 
gtggatggcc accactggga ggtcatgtgg atggatccca aggcgatcca gccgtagccg 34080 
acggggctgg gcgcgccgcc tggaagagcc cccgtgaggc ggggaggcgg gaggatcacc 34140 
gtcttcgtag cccacagcga tgcagtatcc gtcgegcfcte gtatcgaagc acggctgtta 34200 
cgggcgcgte agagcgcgtc gcaggtgatg ccgagccgca gcagcgacac gggcacgagc 3 4260 
gtggctccga tggagatgag ccgagtctcg cccatggtct cggggtcatg aatggatgag 34320 
taggggactc gctccttcgt cacgtcgtgc tcgacggcga cggcgaggcc gagctcgaag 34380 
tgcacggggc ctggaccgaa gatccagctc gccccggcgc gagccccgac gaaaagcgtg 34440 
tcgccgtcga cgccagggcc gtcgtcccag ccgggcgatc ccaccgcggt gtaggtgtgt 34500 
ttcccgaagg aacccgcgag cgagagtcga agtccgaccg gcgctcgcca cgcgacgccc 34560 
gctgtcgcgc cgacgccgcc gaagctctcc ccgaaaggct tatcccctgt ctcgatgaag 34620 
ccacccacct cgatgacgct gatgcggtac gtgagcgcga gattgaggtg caccccagcg 3 4680 
ctgtccgagc ccgagtagag gccggcgccc acctgcacgc tgaaatccat gctcggcgcg 34740 
gatccgcgcg caggagcgac gccaggggcg ctgccctcct gcgcgcgggc cgtcccgacg 34800 
caaagaaaga gggctgtcgc gaagaatcca agcgagatcg atcgaagtga gcgcatgtcg 34860 
ggccctggag catccgctgt accaggtgcg tcgtattcat gcggcgcgcc gccgggcgcc 34920 
gccgcgctgg cctgtccgac gcgagatcac gaatccgcca tegctcccct gggccgccgg 34980 
ccgctctggt tcgcctgcgg gcgtgcgccg gcgctcgtgt ggcccatggc aaccttgtcg 3 5040 
cggtgtcgct cgaacagcac agagagtatc gcgtccgcaa caaccgcgcg acccggcgag 35100 
acgctcgtgg . ggccccctgc ctccccactt catcataacg ccatcaggag cactcgacat 35160 
45 ttcatttctt cacctccact ggctgagggc gacggtgctc gtcatcggcc ggttgctctg 3522 0 
gcggttgctc fcggcggggtt tctgacgccc ggaactaacg cttcgagcgc tcccccttgc 35280 
tctccegttc cttcagctcc tccagcaggt cgtcgaggcg ctcgtagctg ccttcccaga 35340 
agcggcggta gttgtcgagc cagccgctgg cgtcctcgag cggcttggca tcgatccgac 35400 
aaggcctccg ctgcgcgtcg cggccgcgcg agatcaggcc cgctcgctcc agcaccttga 35460 
ggtgcttgga gatcgcgggc tggctcatcg cgaacggctt egccagctcg gtcaccgacg 35520 
cetcgccgga cgcgaggcgc gcgaggatcg ctcgccgtgt cggatcggcg agcgcagcga 35580 
acgttgcgtc gaggcgctcg gacggggtca ttgcataact ccttggtata aaaaccagtt 35640 
agttatacaa cctggggccc gggcggtcaa gcctccaggc gatggcggtt cggcccgggg 35700 
gctccgctcg cggcacgcgc gccgcgcggc tacgtgcgcg gcgcggtgag cacgtcctgc 35760 
agcgtggcgc cgaccacggg cttggtcagg tgcaggtcga agccggcccg cctggacctg 35820 
60 gcctgatcgt cgggcccgcc gtagcccgag agcgccacca ggtagagcgc ttcgccgccg 35880 
ggcgcggccc gcgcccggcg cgcgacctca taaccgtcga tgccgggcaa gccgatgtcc 35940 
acgaaggcca cctcggggcg cagctccaga agcttcttca cgccctccag cccgtccacc 36000 
gccaccgtca cctcgtgccc cagcgcctcg atgtacgccc gcatcacccg gcgcacgtcc 36060 
tccgcgtcct ccacgacgag cacccggcgc cggtcagccg ccgcctcggg cgcctcggcg 36120 
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cgctgcgccg gaggcggcgg cggctcgtcg cgetgcgccg gaggcggccc ctcgcgcgge 36180 
gggggcggec cggcgctcgg ggcaggctgc ggcgccgccc cggggccgag cggcaggcgc 36240 
acggtgaact cgetgccctg gcccggcccg gcgctcgccg cggccacgct gccgccgtgc 36300 
agttccagga gccgccgcac cagcgtgagc ccgagcccca gcccgcccgt gctccggtcg 3 6360 
atggtctggt cgacctgcgt gaacagatcg aacaccttct cgagcatcgc cgccgggatg 36420 
ccgcggcccg tgtcgcgcac ccgcagcacg gcctcgggcg cgccgaccgc cgcctcgcgc 3 6480 
gtgaggcgca ccgagatcga gccccccggc ggggtgtact tcgcggcgtt ggtcaggagg 36540 
ttcgtcacca cctgctccag ccgcgtcgcg tcggcccgca tgccgaagtc cccgggcccc 3 6600 
accgacagcg acacgtcatg gcgccgggcc tcgacggccg gcctcaccgc ggcggcggcg 3 6S60 
ctctgcacca ccgccgcgag atcgacgtcc tcgaggcgca gctccaccgt gccccgcgtg 36720 
atgcgcgaca cgtcgagcag atcgtcgacc agccgcacga ggtggcccat ctgccgccgc 3 6780 
gcgatctccc ggtagcgcgc cgacgcgggc ccgtcgccgt ccgcgtcgtc gagcagcgtc 36840 
agcgacaggc tgatcgaggc catcgggttc cggagctcgt gcgcgagcat cgcgaggaac 3 6900 
tcgtccttgc gctgatcggc gagcttcage gcctcgacga gcgcctecac gcgcctccgg 36960 
gcgcgcacct ggtcggtcac gtcgaacgcg aacacgaaga cgccctcgac cgccccgtcg 37020 
cgatcgcgca tcggctggta gacgaagttg aagaacacct cctccgtcgt gccgtqgccc 37080 
cggcgatcga gccgcaccgg gagctccttg ccgacgatgg gctcgccggt gcggaccacc 37140 
gcgtcgagga gctcccagat gccctgtccc tcgagctcgg ggagggcggc ccggatgggc 37200 
tcgcccacga gcgatcgacc gccgacgagc cgctggtaga gcgggttgac cacctcgaag 372 60 
acgtgctccg gcccgcggag gatggcgatg ggccccgggg cetgcatgaa gaggtcgttc 37320 
aggtactggc gctgcccctc ggcctcgcgc cggcggcgcg cgagctcgac gtggatgcgg 37380 
acccgcgcga ggagctcctt cgcggagaac ggcttcacga ggaagtcgtc ggcgccggcc 37440 
tcgaggctgt cgacgcgcgc ctcctcgccc gcgcgcgcgg agagcatcao cacggcgacg 37500 
ccgcgggtgc gatcgtcggc gcgcagcgcc ctgagcagge cgaagccgtc gagccgcggc 37560 
atcatcacgt cggtgagcac gagatccggc gggtgggcgc gggcgcgctc cagggcggcc 37620 
cgaccgtcgg ccacggcctc caccgtccac ccctccgcca cgagcagccg cagcgcgtac 37680 
tcgcgcatgt ccgcgttgtc gtcggcgacg aggacgcgcc ccggcagcct cccggccggc 37740 
ccctcgcccg ccggccggga cgccggcgcc tgctcgccgc ggagccactg cgcggcctcg 37800 
tcgaggaagg gcgcggcgtc ccgccccccc gcggccggcg ccgaggccgg cgcgac 37856 

Paten tan spriiche 

1. DNA-Sequenz, deren Expressionsprodukte die enzymatische Biosynthcsc, Mutasynthese oder Partialsynthese 45 
von Polyketid- oder Heteropolyketidverbindungen bewirken oder daran bcteiligt sind. 

2. DNA-Sequenz nach Anspruch 1, wobei es sich bei den Polyketid- oder Heteropolyketidverbindungen um Epot- 
hilone handelt. 

3. DNA-Sequenz nach einem der vorhergehenden Anspriiche, wobei die DNA-Sequenz Regulationselemente 
(0RF9, 0RF1 1 und ORF12) und Transkriptionsregulatoren (ORF10, 0RF13 und 0RF14) aufweist und die Expres- 50 
sionsprodute eine tRNA-Synthetase (0RF1), Monooxygenase (ORF2), Aminotransferase (0RF3), lyrosin/DOPA- 
Decarboxylase (0RF4), 3-0xoacyl-ACP-Reduktase (0RF5), Polyketidsynthase (0RF6), Peptidsynthetase (0RF7) 
und Transpeptidase (0RF8) umfassen. 

4. DNA-Sequenz nach einem der vorhergehenden Anspriiche, wobei die DNA aus Myxobakterien stammt. 

5. DNA-Sequenz nach einem der vorhergehenden Anspriiche, wobei die DNA aus Sorangium-Stammen stammt. 55 

6. DNA-Sequenz nach einem der vorhergehenden Anspriiche, wobei die DNA aus Sorangium cellulosum stammt. 

7. DNA-Sequenz nach einem der vorhergehenden Anspriiche, wobei die DNA ausgewahit ist unter: 

(a) der folgenden DNA-Sequenz: oder deren komplementarem Strang, 

(b) DNA-Sequenzen, die unter stringenten Bedingungen an die Proteine kodierenden Regionen der in (a) de- 
finierten DNA-Sequenzen oder an Fragmente davon hybridisiercn, 60 

(c) DNA - Sequenzen, die wegen der Degeneration des genetischen Kodes an die unter (a) und (b) definierten 
DNA-Sequenzen hybridisieren, 

(d) alie Variationen und durch Substitution, Insertion oder Deletion von Nucleotiden entstandene Mutanten 
der unter (a) bis (c) definierten DNA-Sequenzen, die isofunktionelle Expressionsprodukte ergeben. 

8. Rekombinierter Expressionsvektor, der eine DNA-Sequenz nach einem der Anspriiche 1-7 enthalL 65 

9. Prokaryotische oder eukaryotische Zelle, die mit einer DNA-Sequenz nach einem der Anspriiche 1 bis 7 oder mit 
einem rekombinierten Expressionsvektor nach Anspruch 8 transformiert oder transfiziert ist. 

10. Zelle nach Anspruch 9, wobei die Zelle von Myxobakterien stammt. 
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11. Zelle nach Anspruch 9, wobei die Zelle von einern Sorangium-Stamm stammL 

12. Zelle nach Anspruch 9, wobei die Zelle von Sorangium cellulosum stammL 

13. Zelle nach Anspruch 9, wobei die Zelle von einem Streptomyces-Stamm stammt. 

14. Zelle nach Anspruch 9, wobei die Zelle von Escherichia coli stammt. 

5 15. Verfahren zur enzymatischen Biosy nthese, Mutasynthese oder Partialsynthcse von Polyketid- oder Heteropoly- 

ketidverbindungen, bei dem eine Zelle nach einem der Anspriiche 9 bis 14 in einern geeigneten Kulturmedium kul- 
tiviert und die Polyketid- oder Heteropolyketidverbindung aus dem Medium isoliert wird. 
16. Verfahren nach Anspruch 15, wobei die Polyketid- oder Heteropolyketidverbindung ein Epothilon ist. 



10 Hierzu 2 Seite(n) Zeichnungen 
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Gcii/Jiuuktion 


Position 


0RF1 


(RNA-Synthciasc f 


6100-3397 | 


ORF2 


Monooxygenasc 


71I1U5374 


ORF3 


Aminotransferase 


9550-8433 


0RF4 


Tyrosjn/DOPA-Dccarboxylasc 


11393-9354 


ORF5 


3-Oxoacyl-ACP-Rcdaktasc 


12212-13656 


ORF6 


PoJyketidsvntJusc 


15374-19984 


ORF7 


Pcplidsyntbelasc 


20003-27889 


ORF8 


Transpeptidase 


2825 1-29402 


ORF9 


RcgulationscJcment 


31720-30040 


ORF10 


Transicriplioosccgulator 


31982-32932 


ORFIi 


Rcgulationselcmeol 


33128-33613 


ORF 12 


RcgulatioDselcnicnl 


33661-34076 


ORFI3 


TranskripUonsrcgulalor 


35616-35255 


ORF 14 


Transkriplionsrcgulator 


36242-35730 
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